3D圖形芯片及3D圖像生成算法的原理分析
一、引言
3D芯片的處理對象是多邊形表示的物體。用多邊形表示物體有兩個優(yōu)點:首先是直接(盡管繁瑣),多邊形表示的物體其表面的分段線性特征除輪廓外可以通過明暗處理(shading)技術消除;其次是僅存儲多邊形頂點的幾何信息,多邊形內部每個象素的明暗顏色計算所需的信息由這些頂點信息插值而來,這正是易于用圖形硬件支持的快速明暗處理技術。支持多邊形繪制的圖形硬件同樣也可以繪制由雙三次曲面片表示的物體,通過對這種物體的表面進行三角剖分,用逼近的三角形網(wǎng)格代替原物體的曲面表示就可以做到這一點。當然,用多邊形表示物體也有其缺點,如增加了紋理映射和陰影生成的難度,當需要詳細表示復雜物體時所需的三角形數(shù)量將變得非常龐大。
將多邊形表示的物體顯示到計算機屏幕上,這一過程涉及物體在計算機內部的表示方式即物體的數(shù)據(jù)結構,由物體組成的場景的組織結構,物體從場景到屏幕空間要經(jīng)過的一系列變換,以及產(chǎn)生最終屏幕圖象要經(jīng)過的一系列光柵化處理。這些方面都涉及到特定的處理算法,相應的算法又有許多不同的變種。下面僅就3D芯片涉及的圖形處理過程及相關算法做一簡單分析介紹,這些是理解3D圖形處理及圖形硬件的基礎。
二、3D物體的表示法
具有復雜外形的物體其表面可以由多邊形面片來近似表示。以圖1的圓柱為例,其柱面可以由2N個三角形近似,其兩端可以由兩個N邊形來近似。多邊形模型在其輪廓上的分段線性特征是這一表示法主要的視覺缺陷,改進的唯一途徑是增加多邊形的分辨率。對于一個復雜形體來說,為了充分表示其細節(jié),常常要用到十萬個以上的多邊形。這將耗費許多數(shù)據(jù)庫訪問時間和繪制時間。當將多邊形模型進行放大處理時,會產(chǎn)生連接問題。這就是所謂的“幾何走樣”。物體的多邊形表示既可以通過交互設計人工提取,也可以通過激光掃描設備得到??傊?,多邊形表示的物體并不特別適合于交互操作或做自由的形狀改變。當改變物體的形狀時很難保證多邊形表示的完整性得到保持。
對多邊形明暗著色所需要的信息存儲在一個分層的數(shù)據(jù)結構中,每一個物體表面由指向多邊形表的指針定義,該多邊形表包含了近似該表面的一組多邊形,每一個多邊形由指向頂點表的指針定義,頂點表包含了每個多邊形的所有頂點。具體來說需要為每個多邊形存儲以下信息:
1)多邊形的頂點表,每一個頂點是一個三維坐標,該坐標定義在創(chuàng)建該物體時的局部坐標系中。
2)頂點的法向量表,這是明暗處理算法所要求的信息。向量由同一局部坐標系中的三分量表示。
3)多邊形的法向量,它是包含該多邊形的平面的真正的幾何法向量。這是背面刪除操作所需要的信息。
繪制多邊形物體的傳統(tǒng)方法是將多邊形作為獨立的繪制實體,這樣多邊形之間的共享邊就要被處理兩次。為避免這種情況,可采用基于邊的繪制方法,這時多邊形的表示是基于多邊形的邊而不是多邊形本身?;谶叺姆椒ㄒ馕吨L制過程的組織要采用基于掃描線的算法,基于掃描線的算法將同時處理與當前掃描線相交的所有多邊形。這時存儲器中能存儲的可被同時處理的多邊形的最大數(shù)目將成為可繪制的場景復雜度的上限。使用全屏Z-buffer并將掃描線算法局限在物體所包含的多邊形上就可以解決這一問題。
三、坐標系統(tǒng)
繪制過程的幾何處理部分可被看成應用一系列的坐標變換將物體數(shù)據(jù)庫變換到一系列的坐標系下,這些坐標系對所有繪制系統(tǒng)都是公用的,是理解3D圖形學的基礎。用計算機生成圖象的一系列基本操作與繪制過程要經(jīng)歷的一系列空間即坐標系有關。隨著繪制過程的進行處理將從一個空間進入下一個空間。已完整地建立起描述這些變換的方法。在對物體實施變換時希望對頂點和頂點的法向量使用相同的變換矩陣。事實上,當變換在所有方向并不相同時,頂點法向量必須采用不同的變換矩陣。由于單位法向量經(jīng)過變換之后其長度不一定仍保持不變,因而必須對其進行重新單位化處理(單位法向量是光照計算所要求的)。
1.局部坐標系(局部空間)
為了建模和進行局部變換的方便可選擇被建模物體之內或附近的某一點作為局部坐標系的原點。例如可選擇一個立方體的某一頂點作為坐標原點,三個坐標軸即是與該頂點相連的立方體的三條邊。在局部坐標系選定之后,物體各頂點的局部坐標以及相對于該局部坐標系的各頂點的法向量和物體上多邊形的法向量就可以被提取并存儲起來。
2.世界坐標系(世界空間)
當每一個物體在其局部坐標系中被建立起來之后,就需要將其放置到將要繪制的場景之中。組成場景的每個物體都有自己獨立的局部坐標系。整個場景的坐標系就是所謂的世界坐標系。場景中的所有物體都必須從自己的局部坐標系中變換到世界坐標系中以定義場景中物體之間的空間相對關系。如果一個物體在場景中被定義為運動的,則必須為該物體定義一個隨時間變化的變換序列以便在每一幀將該物體變換到世界坐標系中的不同位置。場景中的光源也在世界坐標系中定義。如果光照計算是在世界空間中進行,則對物體法向量的變換到此為止。對物體表面屬性如紋理、顏色等的定義和調整也在世界空間中進行。
3.眼睛坐標系、相機坐標系或觀察坐標系(眼睛空間)
眼睛坐標系統(tǒng)是用來建立對世界空間進行觀察時的觀察參數(shù)和觀察范圍的。在圖形學中通常用假想的相機來輔助對觀察系統(tǒng)的理解。一個假想的相機可以以任意方向放置在世界空間的任何位置,膠片平面在圖形學中就是觀察平面,也就是場景將投影到其上的平面。建立一個普遍適用的觀察空間相當繁瑣,在多數(shù)情況下是對眼睛坐標空間做許多限制。一個最小的實用系統(tǒng)可以這樣建立,首先要求眼睛坐標系的原點和投影中心是世界坐標系中的同一個坐標點;其次要求觀察平面的法向量和觀察方向在眼睛空間中與Z坐標軸重合;最后,觀察方向必須是這樣的,當相機朝著Z軸的正向時Z值的增加將遠離眼睛的位置,同時在左手坐標系的前提下,X軸指向右,Y軸向上。滿足這一要求的系統(tǒng)就可以使假想的相機以任何觀察方向放置在世界坐標空間中的任何位置。圖2 是有關坐標系之間的關系。
眼睛坐標系是最適宜做背面刪除的空間。背面刪除操作是將背對觀察者的多邊形全部剔除,在場景中這些多邊形對于觀察者來說是不可見的。如果對一個凸物體做背面刪除,則可以完全解決其隱藏面問題。對于具有凹面的物體而言這一操作并不能解決隱藏面問題。背面刪除操作是通過計算多邊形所在平面的法向量與視線向量之間的夾角來決定該平面是否可見。如果這兩個向量的點積大于0,意味著其夾角小于90o 即該多邊形是可見的,否則為不可見。視線向量是從多邊形指向視點的向量。多邊形平面的法向量可通過其不共線的三個頂點計算而得。多邊形的法向量必須指向物體的外部,為保證這一點,多邊形的頂點必須以反時針方向(從多邊形外部看時)順序存儲。如圖3所示。
4.屏幕坐標系(屏幕空間)
屏幕空間是比較難于靠直覺理解的一種空間概念。它是描述如何觀察場景的方法的過程,與透視幾何有關,也可以理解為怎樣定義場景中能夠到達眼睛(或相機)的光線的過程。將場景中的一個點投影到距離視點為D的觀察平面或屏幕要用到的基本變換是透視變換,屏幕或觀察平面的法向與觀察方向一致。從圖4可以看到,運用相似三角形原理,點P在屏幕上的投影P’(Xs= Dxe/Ze, ys=Dye/Ze)。屏幕與觀察平面略有不同,屏幕是觀察平面上的一塊矩形區(qū)域,在經(jīng)過一個與設備有關的變換之后,可以從觀察平面坐標求得屏幕坐標。屏幕空間的定義使得其只對一個封閉空間中所包圍的場景進行繪制處理,這個封閉的空間稱作視錐臺。它可以這樣來描述:設想在距離視點D處的觀察平面上有一尺寸為2h的正方形窗口,且該窗口關于觀察方向是對稱的,則平面
xe=±hze/D ye=±hze/D
ze=D ze=F
將構成一個封閉的錐臺。其中xe、ye 、ze是指眼睛坐標系中的坐標,而平面ze=D和平面ze=F分別稱作近處和遠處的裁剪平面,它們垂直于觀察方向,在此我們假設觀察平面與近處的裁剪平面重合。如圖4所示。對于透視投影而言,通過連接窗口角與投影中心就形成所謂的視錐體。
有了這個視錐體,就可以用它對已變換到眼睛坐標系下的場景進行選擇。這不外有三種情況,對于那些完全落在視椎臺之內的物體,直接通過透視變換將其變換到屏幕坐標系下;對于那些完全落在視椎臺之外的物體不作進一步的處理而直接拋棄;對于那些與視椎臺的面相交的物體則應作裁剪處理,裁取其位于錐臺內的部分并用透視變換將它們變換到屏幕坐標系下。在屏幕坐標系下,Z坐標將作為判斷物體面之間相互遮擋的唯一判據(jù)。
注意,場景中的每個物體的每個三角形都要經(jīng)過以上處理過程。
四、象素處理
經(jīng)過以上一系列的變換之后,一個多邊形已變換到屏幕坐標系下。將一個屏幕多邊形在屏幕上繪制出來就是多邊形的象素處理過程,它包括光柵化、隱藏面消除、明暗處理。光柵化、隱藏面消除、明暗處理是整個3D圖形生成過程中最內層的處理。他們是三個二維插值過程。光柵化是用屏幕空間三角形的頂點坐標插值,以求得三角形的邊所截取的三角形內掃描線段的端點坐標,并進而求得所截掃描線段上的象素坐標。隱藏面消除則是通過對屏幕空間三角形頂點的深度值(Z坐標)進行插值,從而獲得三角形內掃描線段上每個象素的深度值。明暗處理是用同樣的方法由頂點光強求得三角形內掃描段上每個象素的光強。這三種處理的算法具有相同的數(shù)學表示形式,只需將坐標、深度或光強代入該方程就可以得到相應的結果。總之,場景的繪制過程可概括為:
對場景中的每個物體的每個多邊形做幾何變換將其變換到屏幕空間;
對多邊形內的每一個掃描段求出其端點及其上每個象素的坐標;
對掃描段上的每個象素做隱藏面消除處理及明暗處理。
1.光柵化
光柵化處理通過插值求得三角形內掃描段的x坐標的起點和終點。問題是何處是終點和起點?當使用實數(shù)坐標時在象素之內的何處進行采樣,屏幕坐標是取整數(shù)還是保留小數(shù)精度?這些問題如果處理得不好,就會在多邊形之間產(chǎn)生孔洞,產(chǎn)生重疊的多邊形,這會在透明效果處理時產(chǎn)生嚴重問題。如果反走樣處理不精確,則會在帶有紋理的表面上產(chǎn)生紋理不連續(xù)現(xiàn)象。例如,如果對屏幕坐標取整,則屏幕多邊形的頂點將延伸或縮回到離它最近的象素,這樣多邊形的大小將發(fā)生微小的變化,而且不能用密集采樣進行反走樣處理,動畫中的“顫抖”現(xiàn)象便是由此而引起的。在象素內何處采樣并不重要,重要的是對象素采樣的處理必須一致。
2.隱藏面消除
全屏幕Z-Buffer(深度緩存器)算法已成為圖形學事實上的標準隱藏面消除算法,他雖然簡單但存儲要求很高。Z-Buffer算法可看作是工作在三維屏幕空間。每一個象素有一個二維屏幕空間坐標( xs , ys )和由眼睛空間頂點的深度值插值而得到的z深度值。深度緩存器開始時被初始化為遠處裁剪平面的深度,對每一個象素比較其插值得到的深度值與已存儲在深度緩存中( xs , ys )處的值,如果該值小于存儲值,則新計算的象素更靠近觀察者。這時新計算的象素的明暗處理值將覆蓋幀緩存中的舊值,深度存儲器中的值也換成新計算的值。深度緩存器算法對場景數(shù)據(jù)庫組織及場景復雜性沒有限制。在處理復雜場景或物體時,應保證足夠的深度精度。
3.明暗處理
首先計算多邊形頂點的明暗參數(shù),然后在多邊形平面上進行插值。這樣繪制出的物體不但具有很強的三維立體感,而且消除了用于近似曲面的多邊形之間的公用邊所形成的不連續(xù)特征。實現(xiàn)這一處理方式的算法有兩種,一種稱作Gouraud明暗處理,一種稱作Phong明暗處理(均以發(fā)明者的名字命名)。這也是基于多邊形的繪制日益受歡迎的一個重要原因。Gouraud明暗處理的速度快,但不能產(chǎn)生精確的高光效果,通常用在對速度要求高的場合,如飛行模擬、交互式CAD應用等。Phong明暗處理可以生成高質量的圖像,但將耗費龐大的硬件資源。Gouraud明暗處理僅在多邊形的頂點使用局部反射光照模型計算光強,然后使用頂點處的光強通過插值求出多邊形內各象素的光強值。而Phong明暗處理則對頂點的法向量進行插值,并對多邊形內的每一個象素用局部反射光照模型計算其光強。一般說來,多邊形頂點的光強是頂點的法向量相對于光源和視點的方向的函數(shù),這就是所謂的局部反射光照模型。頂點的法向量用來近似原物體表面在該點處的法向量,通過平均公用該頂點的所有多邊形的法向量求得。
Gouraud明暗處理僅與局部光照模型中的漫反射分量一起使用,這是因為當高光點完全落在多邊形之內時,其對多邊形頂點處沒有任何影響。該方法是目前3D圖形硬件都支持的唯一的明暗處理方法。
4.特殊效果
紋理映射、透明以及霧化(大氣效應)等真實感效果都是在象素處理階段實現(xiàn)的。物體表面紋理的定義是在世界坐標系中進行的,通過預處理,每個帶有紋理的多邊形在其頂點數(shù)據(jù)中建立了與相應紋理圖的映射關系。在繪制帶有紋理的多邊形時,其相應的紋理圖也同時被加載到紋理存儲器中,在求出物體上象素坐標的同時其相應的紋理坐標也被計算出來。用該紋理坐標從紋理存儲器中讀出相應紋理象素的值,將其與明暗處理的結果進行混合就得到要顯示的象素值。霧化(大氣效應)則是在計算出的象素值上乘上一個與深度有關的衰減因子。對落在同一屏幕位置的象素點的象素值按其所屬物體的透明系數(shù)進行加權融合就可以產(chǎn)生透明效果。
五、結束語
3D圖形應用對計算和存儲資源的巨大需求以及3D圖形生成算法與傳統(tǒng)計算機體系結構的不相適應產(chǎn)生了3D圖形硬件。PC機上的3D圖形硬件的出現(xiàn)只是最近幾年的事,它是技術進步和市場推動的結果。目前,3D圖形硬件既有高端的專用圖形工作站也有入門級的圖形加速卡,任何更好更快的圖形效果的獲得都需要付出巨大的硬件代價。
全息投影相關文章:全息投影原理
評論