關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 圖文教你選擇和區(qū)別A卡和N卡

圖文教你選擇和區(qū)別A卡和N卡

作者: 時(shí)間:2012-12-11 來(lái)源:網(wǎng)絡(luò) 收藏

曾經(jīng)有不少網(wǎng)友問(wèn)過(guò)“A卡好還是N卡好”這個(gè)問(wèn)題,不過(guò)隨著近年來(lái),顯卡性能大幅提升,中高端顯卡對(duì)于多數(shù)用戶來(lái)說(shuō)已都已經(jīng)耳熟能詳了,那下面來(lái)看看2012年最新的關(guān)于A卡與N卡區(qū)別對(duì)比吧。

本文引用地址:http://2s4d.com/article/202026.htm

N卡和A卡兩家架構(gòu)問(wèn)題要深究就得寫一本書了。在DX9以前的時(shí)代,兩家的架構(gòu)主要由像素單元、頂點(diǎn)單元、紋理單元、光柵單元組成,一個(gè)渲染流程的所有單元綁在一起組成一條渲染管線,管線越多,性能就越強(qiáng)。而游戲中的指令以4D指令居多(像素有RGBA,頂點(diǎn)有XYZW),這些單元就被設(shè)計(jì)成了一次能處理4D指令的處理器,對(duì)于當(dāng)時(shí)的游戲環(huán)境來(lái)說(shuō)這種架構(gòu)效率很高。但到了DX9后期甚至DX10時(shí)代,游戲中的1D、2D、3D、4D指令開始頻繁混合出現(xiàn),像素與頂點(diǎn)的渲染量比例也有了改變,原先的架構(gòu)就變得效率低下了,比如一個(gè)處理單元一次能處理4D運(yùn)算,當(dāng)碰到1D運(yùn)算時(shí)就只用到4/1的資源,剩下3/4的資源就閑置掉了,相當(dāng)于效率降低了4倍。而有些游戲的像素渲染量明顯多于頂點(diǎn),那么這些綁在一起數(shù)量比例固定的單元就效率低下了,比如像素吃力的時(shí)候,頂點(diǎn)可能比較空閑,非常浪費(fèi)資源。為了解決這個(gè)問(wèn)題,NV和ATI都對(duì)架構(gòu)進(jìn)行了改進(jìn),但都治標(biāo)不治本。這時(shí)候重新設(shè)計(jì)架構(gòu)成為了必然,所以,從DX10時(shí)代起,兩家的架構(gòu)就起了翻天復(fù)地的變化。

當(dāng)兩家DX10產(chǎn)品面市后,人們驚奇的發(fā)現(xiàn),竟然是兩種不同的架構(gòu)。

N卡的架構(gòu)思路很簡(jiǎn)單,用強(qiáng)大的前端處理器把所有指令拆分成一個(gè)個(gè)1D指令,而下面所有處理單元都變成了1D單元(流處理器),這些流處理器都能當(dāng)做像素和頂點(diǎn)單元來(lái)使用,每個(gè)單元都能獨(dú)立收發(fā)指令,這樣不管碰到什么類型的指令都能“一擁而上”,效率幾乎達(dá)到100%的理想程度,是標(biāo)準(zhǔn)的線程級(jí)并行架構(gòu),也是追求高效率的理想架構(gòu)。

1.jpg

N卡標(biāo)志

N卡的架構(gòu)看上去很完美,但缺點(diǎn)也很明顯,由于每個(gè)流處理器都對(duì)應(yīng)獨(dú)立的指令發(fā)射端和控制單元這類東西,體積龐大,控制單元在晶體管的消耗上占了相當(dāng)大的比例,在相同晶體管數(shù)量的情況下,N卡能做的運(yùn)算單元就相對(duì)少很多。在流處理器數(shù)量相對(duì)少的情況下,處理4D指令時(shí)又會(huì)顯得性能不足(因?yàn)橐馁M(fèi)四個(gè)流處理器去處理一個(gè)指令),所以N卡的流處理器頻率會(huì)比核心頻率高出一倍以上,以彌補(bǔ)數(shù)量上的缺陷。由以上缺點(diǎn)又造成了另一個(gè)缺點(diǎn),就是功耗巨大。

總結(jié),N卡架構(gòu)執(zhí)行效率極高,靈活性強(qiáng),在實(shí)際應(yīng)用中容易發(fā)揮應(yīng)有性能。但功耗較難控制,較少的處理單元也限制了其理論運(yùn)算能力。

A卡方面,雖然也是采用了通用的1D流處理器做為執(zhí)行單元,但采用的是指令級(jí)并行架構(gòu),每5個(gè)流處理器為一組,每組一次最大可接收一條5D指令(而N卡接收的是1D指令),在前端上就把所有指令打包成一個(gè)個(gè)5D指令發(fā)下去(而N卡是拆分成一個(gè)個(gè)1D發(fā)下去),所以A卡的架構(gòu)又被稱為5D架構(gòu)。這樣的設(shè)計(jì)可以實(shí)現(xiàn)高指令吞吐,能在較少的控制單元下做出龐大的運(yùn)算單元,晶體管消耗也較少,所以A卡的流處理器一般都是N卡的4-5倍,理論運(yùn)算能力也遠(yuǎn)強(qiáng)于N卡,功耗也相對(duì)要低一些,同性能的芯片面積也都比較小。

2.jpg

A卡標(biāo)志

但是,A卡架構(gòu)的缺點(diǎn)也很明顯,雖然理論上總運(yùn)算性能強(qiáng)大,但一旦碰到混合指令或條件指令的時(shí)候,前端就很難實(shí)現(xiàn)完整的5D打包,往往變成3D、2D、1D的發(fā)下去了,造成每組流處理器只有3、2甚至1個(gè)在工作,幾乎一半的單元浪費(fèi)掉了。軟件要想針對(duì)這種架構(gòu)優(yōu)化,必需減少混合、條件指令的出現(xiàn)(需要耗費(fèi)程序員的大量精力),或杜絕(這是不可能的)。所以在軟件優(yōu)化度上A卡是處于劣勢(shì)的,常常無(wú)法發(fā)揮應(yīng)有性能。

總結(jié),A卡架構(gòu)優(yōu)勢(shì)在于理論運(yùn)算能力,但執(zhí)行效率不高,對(duì)于復(fù)雜多變的任務(wù)種類適應(yīng)性不強(qiáng),如果沒(méi)有軟件上的支持,常常無(wú)法發(fā)揮應(yīng)有性能。所以A卡除了需要游戲廠商的支持外,自己也要常常發(fā)布針對(duì)某款游戲優(yōu)化的驅(qū)動(dòng)補(bǔ)丁(造成A卡發(fā)布半年后,還可通過(guò)驅(qū)動(dòng)提升性能的現(xiàn)象)。

在物理加速技術(shù)方面,全球主流的是Havok技術(shù),目前為INTEL所有,平臺(tái)支持度高,各廠商(包括AMD)也都默認(rèn)對(duì)其支持,在游戲支持度上占了60%以上市場(chǎng)份額。但該技術(shù)偏重CPU處理(少部分可由A卡協(xié)處理),性能比較有限,可展現(xiàn)的效果規(guī)模較小。

而物理技術(shù)的另一股新勢(shì)力就是AGEIA公司的PhysX技術(shù),硬件上以獨(dú)立的加速卡形式存在,性能專一且強(qiáng)勁,能夠展現(xiàn)更復(fù)雜的物理效果,但該技術(shù)并不開放,而且要購(gòu)買加速卡才能實(shí)現(xiàn),限制了其支持度。自08年NV收購(gòu)AGEIA公司后,PhysX技術(shù)就變成N卡專屬,在DX10架構(gòu)以后的N卡中都集成了PhysX物理引擎,但封閉的策略還是沒(méi)變,要想實(shí)現(xiàn)PhysX物理效果,用戶必需擁有一塊DX10以上級(jí)別的N卡,這對(duì)于游戲廠商來(lái)說(shuō)比較冒險(xiǎn),如果“足夠性能”的硬件用戶量不足,那么軟件廠商就虧大了,所以支持PhysX技術(shù)的游戲數(shù)量至今也沒(méi)占到主流,很多廠商寧可對(duì)N卡優(yōu)化,也不支持PhysX技術(shù)。不過(guò)NV通過(guò)強(qiáng)勢(shì)的營(yíng)銷策略,甚至有些時(shí)候是“非常規(guī)”的營(yíng)銷,為人所知,市場(chǎng)前景也是被看好的。

總結(jié):在物理加速技術(shù)上NV屬于劍走偏鋒型,企圖利用封閉的技術(shù)搞壟斷排擠(與索尼的儲(chǔ)存卡(記憶棒)有點(diǎn)相似),但要排擠主流的AMD、INTEL陣營(yíng)是難上加難,結(jié)局是否和索尼一樣我們不得而知。

目前來(lái)看,支持PhysX技術(shù)的游戲只相當(dāng)于Havok的三成左右,數(shù)量不占優(yōu)勢(shì),而很多初學(xué)者把支持物理加速技術(shù)和游戲優(yōu)化的概念搞混了,以為針對(duì)N卡優(yōu)化的游戲就采用PhysX技術(shù),其實(shí)這兩者沒(méi)有什么關(guān)系,針對(duì)N卡優(yōu)化的游戲雖然較多,但采用PhysX物理技術(shù)的游戲是比較少的。這方面兩家算是不分勝負(fù),但在選購(gòu)上N卡又多了個(gè)籌碼。

c++相關(guān)文章:c++教程



上一頁(yè) 1 2 3 下一頁(yè)

關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉