圖文教你選擇和區(qū)別A卡和N卡

作者：時(shí)間：2012-12-11 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

曾經(jīng)有不少網(wǎng)友問(wèn)過(guò)“A卡好還是N卡好”這個(gè)問(wèn)題，不過(guò)隨著近年來(lái)，顯卡性能大幅提升，中高端顯卡對(duì)于多數(shù)用戶來(lái)說(shuō)已都已經(jīng)耳熟能詳了，那下面來(lái)看看2012年最新的關(guān)于A卡與N卡區(qū)別對(duì)比吧。

本文引用地址：http://2s4d.com/article/202026.htm

N卡和A卡兩家架構(gòu)問(wèn)題要深究就得寫(xiě)一本書(shū)了。在DX9以前的時(shí)代，兩家的架構(gòu)主要由像素單元、頂點(diǎn)單元、紋理單元、光柵單元組成，一個(gè)渲染流程的所有單元綁在一起組成一條渲染管線，管線越多，性能就越強(qiáng)。而游戲中的指令以4D指令居多（像素有RGBA，頂點(diǎn)有XYZW），這些單元就被設(shè)計(jì)成了一次能處理4D指令的處理器，對(duì)于當(dāng)時(shí)的游戲環(huán)境來(lái)說(shuō)這種架構(gòu)效率很高。但到了DX9后期甚至DX10時(shí)代，游戲中的1D、2D、3D、4D指令開(kāi)始頻繁混合出現(xiàn)，像素與頂點(diǎn)的渲染量比例也有了改變，原先的架構(gòu)就變得效率低下了，比如一個(gè)處理單元一次能處理4D運(yùn)算，當(dāng)碰到1D運(yùn)算時(shí)就只用到4/1的資源，剩下3/4的資源就閑置掉了，相當(dāng)于效率降低了4倍。而有些游戲的像素渲染量明顯多于頂點(diǎn)，那么這些綁在一起數(shù)量比例固定的單元就效率低下了，比如像素吃力的時(shí)候，頂點(diǎn)可能比較空閑，非常浪費(fèi)資源。為了解決這個(gè)問(wèn)題，NV和ATI都對(duì)架構(gòu)進(jìn)行了改進(jìn)，但都治標(biāo)不治本。這時(shí)候重新設(shè)計(jì)架構(gòu)成為了必然，所以，從DX10時(shí)代起，兩家的架構(gòu)就起了翻天復(fù)地的變化。

當(dāng)兩家DX10產(chǎn)品面市后，人們驚奇的發(fā)現(xiàn)，竟然是兩種不同的架構(gòu)。

N卡的架構(gòu)思路很簡(jiǎn)單，用強(qiáng)大的前端處理器把所有指令拆分成一個(gè)個(gè)1D指令，而下面所有處理單元都變成了1D單元（流處理器），這些流處理器都能當(dāng)做像素和頂點(diǎn)單元來(lái)使用，每個(gè)單元都能獨(dú)立收發(fā)指令，這樣不管碰到什么類(lèi)型的指令都能“一擁而上”，效率幾乎達(dá)到100%的理想程度，是標(biāo)準(zhǔn)的線程級(jí)并行架構(gòu)，也是追求高效率的理想架構(gòu)。

N卡標(biāo)志

N卡的架構(gòu)看上去很完美，但缺點(diǎn)也很明顯，由于每個(gè)流處理器都對(duì)應(yīng)獨(dú)立的指令發(fā)射端和控制單元這類(lèi)東西，體積龐大，控制單元在晶體管的消耗上占了相當(dāng)大的比例，在相同晶體管數(shù)量的情況下，N卡能做的運(yùn)算單元就相對(duì)少很多。在流處理器數(shù)量相對(duì)少的情況下，處理4D指令時(shí)又會(huì)顯得性能不足（因?yàn)橐馁M(fèi)四個(gè)流處理器去處理一個(gè)指令），所以N卡的流處理器頻率會(huì)比核心頻率高出一倍以上，以彌補(bǔ)數(shù)量上的缺陷。由以上缺點(diǎn)又造成了另一個(gè)缺點(diǎn)，就是功耗巨大。

總結(jié)，N卡架構(gòu)執(zhí)行效率極高，靈活性強(qiáng)，在實(shí)際應(yīng)用中容易發(fā)揮應(yīng)有性能。但功耗較難控制，較少的處理單元也限制了其理論運(yùn)算能力。

A卡方面，雖然也是采用了通用的1D流處理器做為執(zhí)行單元，但采用的是指令級(jí)并行架構(gòu)，每5個(gè)流處理器為一組，每組一次最大可接收一條5D指令（而N卡接收的是1D指令），在前端上就把所有指令打包成一個(gè)個(gè)5D指令發(fā)下去（而N卡是拆分成一個(gè)個(gè)1D發(fā)下去），所以A卡的架構(gòu)又被稱為5D架構(gòu)。這樣的設(shè)計(jì)可以實(shí)現(xiàn)高指令吞吐，能在較少的控制單元下做出龐大的運(yùn)算單元，晶體管消耗也較少，所以A卡的流處理器一般都是N卡的4-5倍，理論運(yùn)算能力也遠(yuǎn)強(qiáng)于N卡，功耗也相對(duì)要低一些，同性能的芯片面積也都比較小。

A卡標(biāo)志

但是，A卡架構(gòu)的缺點(diǎn)也很明顯，雖然理論上總運(yùn)算性能強(qiáng)大，但一旦碰到混合指令或條件指令的時(shí)候，前端就很難實(shí)現(xiàn)完整的5D打包，往往變成3D、2D、1D的發(fā)下去了，造成每組流處理器只有3、2甚至1個(gè)在工作，幾乎一半的單元浪費(fèi)掉了。軟件要想針對(duì)這種架構(gòu)優(yōu)化，必需減少混合、條件指令的出現(xiàn)（需要耗費(fèi)程序員的大量精力），或杜絕（這是不可能的）。所以在軟件優(yōu)化度上A卡是處于劣勢(shì)的，常常無(wú)法發(fā)揮應(yīng)有性能。

總結(jié)，A卡架構(gòu)優(yōu)勢(shì)在于理論運(yùn)算能力，但執(zhí)行效率不高，對(duì)于復(fù)雜多變的任務(wù)種類(lèi)適應(yīng)性不強(qiáng)，如果沒(méi)有軟件上的支持，常常無(wú)法發(fā)揮應(yīng)有性能。所以A卡除了需要游戲廠商的支持外，自己也要常常發(fā)布針對(duì)某款游戲優(yōu)化的驅(qū)動(dòng)補(bǔ)丁（造成A卡發(fā)布半年后，還可通過(guò)驅(qū)動(dòng)提升性能的現(xiàn)象）。

在物理加速技術(shù)方面，全球主流的是Havok技術(shù)，目前為INTEL所有，平臺(tái)支持度高，各廠商（包括AMD）也都默認(rèn)對(duì)其支持，在游戲支持度上占了60%以上市場(chǎng)份額。但該技術(shù)偏重CPU處理（少部分可由A卡協(xié)處理），性能比較有限，可展現(xiàn)的效果規(guī)模較小。

而物理技術(shù)的另一股新勢(shì)力就是AGEIA公司的PhysX技術(shù)，硬件上以獨(dú)立的加速卡形式存在，性能專一且強(qiáng)勁，能夠展現(xiàn)更復(fù)雜的物理效果，但該技術(shù)并不開(kāi)放，而且要購(gòu)買(mǎi)加速卡才能實(shí)現(xiàn)，限制了其支持度。自08年NV收購(gòu)AGEIA公司后，PhysX技術(shù)就變成N卡專屬，在DX10架構(gòu)以后的N卡中都集成了PhysX物理引擎，但封閉的策略還是沒(méi)變，要想實(shí)現(xiàn)PhysX物理效果，用戶必需擁有一塊DX10以上級(jí)別的N卡，這對(duì)于游戲廠商來(lái)說(shuō)比較冒險(xiǎn)，如果“足夠性能”的硬件用戶量不足，那么軟件廠商就虧大了，所以支持PhysX技術(shù)的游戲數(shù)量至今也沒(méi)占到主流，很多廠商寧可對(duì)N卡優(yōu)化，也不支持PhysX技術(shù)。不過(guò)NV通過(guò)強(qiáng)勢(shì)的營(yíng)銷(xiāo)策略，甚至有些時(shí)候是“非常規(guī)”的營(yíng)銷(xiāo)，為人所知，市場(chǎng)前景也是被看好的。

總結(jié)：在物理加速技術(shù)上NV屬于劍走偏鋒型，企圖利用封閉的技術(shù)搞壟斷排擠（與索尼的儲(chǔ)存卡（記憶棒）有點(diǎn)相似），但要排擠主流的AMD、INTEL陣營(yíng)是難上加難，結(jié)局是否和索尼一樣我們不得而知。

目前來(lái)看，支持PhysX技術(shù)的游戲只相當(dāng)于Havok的三成左右，數(shù)量不占優(yōu)勢(shì)，而很多初學(xué)者把支持物理加速技術(shù)和游戲優(yōu)化的概念搞混了，以為針對(duì)N卡優(yōu)化的游戲就采用PhysX技術(shù)，其實(shí)這兩者沒(méi)有什么關(guān)系，針對(duì)N卡優(yōu)化的游戲雖然較多，但采用PhysX物理技術(shù)的游戲是比較少的。這方面兩家算是不分勝負(fù)，但在選購(gòu)上N卡又多了個(gè)籌碼。

c++相關(guān)文章:c++教程

上一頁(yè) 1 2 3 下一頁(yè)

新聞中心

圖文教你選擇和區(qū)別A卡和N卡

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)