圖卷積和消息傳遞理論的可視化詳解
來源:Deephub Imba
假設(shè)現(xiàn)在需要設(shè)計(jì)治療某些疾病的****物。有一個(gè)其中包含成功治療疾病的****物和不起作用的****物數(shù)據(jù)集,現(xiàn)在需要設(shè)計(jì)一種新****,并且想知道它是否可以治療這種疾病。如果可以創(chuàng)建一個(gè)有意義的****物表示,就可以訓(xùn)練一個(gè)分類器來預(yù)測(cè)它是否對(duì)疾病治療有用。我們的****物是分子式,可以用圖表表示。該圖的節(jié)點(diǎn)是原子。也可以用特征向量 x 來描述原子(它可以由原子屬性組成,如質(zhì)量、電子數(shù)或其他)。為了對(duì)分子進(jìn)行分類,我們希望利用有關(guān)其空間結(jié)構(gòu)和原子特征的知識(shí)來獲得一些有意義的表示。
以圖形表示的分子示例。原子有它們的特征向量 X。特征向量中的索引表示節(jié)點(diǎn)索引。
最直接的方法是聚合特征向量,例如,簡單地取它們的平均值:
這是一個(gè)有效的解決方案,但它忽略了重要的分子空間結(jié)構(gòu)。
我們可以提出另一種想法:用鄰接矩陣表示分子圖,并用特征向量“擴(kuò)展”其深度。我們得到了一個(gè)偽圖像 [8, 8, N],其中 N 是節(jié)點(diǎn)特征向量 x 的維數(shù)?,F(xiàn)在可以使用常規(guī)卷積神經(jīng)網(wǎng)絡(luò)并提取分子嵌入。
圖結(jié)構(gòu)可以表示為鄰接矩陣。節(jié)點(diǎn)特征可以表示為圖像中的通道(括號(hào)代表連接)。
這種方法利用了圖結(jié)構(gòu),但有一個(gè)巨大的缺點(diǎn):如果改變節(jié)點(diǎn)的順序會(huì)得到不同的表示。所以這樣的表示不是置換不變量。但是鄰接矩陣中的節(jié)點(diǎn)順序是任意的, 例如,可以將列順序從 [0, 1, 2, 3, 4, 5, 6, 7] 更改為 [0, 2, 1, 3, 5, 4, 7, 6],它仍然是 圖的有效鄰接矩陣。所以可以創(chuàng)建所有可能的排列并將它們堆疊在一起,這會(huì)使我們有 1625702400 個(gè)可能的鄰接矩陣(8!* 8?。?shù)據(jù)量太大了,所以應(yīng)該找到更好的解決方案。
但是問題是,我們?nèi)绾握峡臻g信息并有效地做到這一點(diǎn)?上面的例子可以讓我們想到卷積的概念,但它應(yīng)該在圖上完成。
所以圖卷積就出現(xiàn)了
當(dāng)對(duì)圖像應(yīng)用常規(guī)卷積時(shí)會(huì)發(fā)生什么?相鄰像素的值乘以過濾器權(quán)重并相加。我們可以在圖表上做類似的事情嗎?是的,可以在矩陣 X 中堆疊節(jié)點(diǎn)特征向量并將它們乘以鄰接矩陣 A,然后得到了更新的特征 X`,它結(jié)合了有關(guān)節(jié)點(diǎn)最近鄰居的信息。為簡單起見,讓我們考慮一個(gè)具有標(biāo)量節(jié)點(diǎn)特征的示例:
標(biāo)量值節(jié)點(diǎn)特征的示例。僅針對(duì)節(jié)點(diǎn) 0 說明了 1 跳距離,但對(duì)于所有其他節(jié)點(diǎn)也是一樣的。
每個(gè)節(jié)點(diǎn)都會(huì)獲得有關(guān)其最近鄰居的信息(也稱為 1 跳距離)。鄰接矩陣上的乘法將特征從一個(gè)節(jié)點(diǎn)傳播到另一個(gè)節(jié)點(diǎn)。
在圖像域中可以通過增加濾波器大小來擴(kuò)展感受野。在圖中則可以考慮更遠(yuǎn)的鄰居。如果將 A^2 乘以 X——關(guān)于 2 跳距離節(jié)點(diǎn)的信息會(huì)傳播到節(jié)點(diǎn):
節(jié)點(diǎn) 0 現(xiàn)在具有關(guān)于節(jié)點(diǎn) 2 的信息,該信息位于 2 跳距離內(nèi)。該圖僅針對(duì)節(jié)點(diǎn) 0 說明了躍點(diǎn),但對(duì)于所有其他節(jié)點(diǎn)也是如此。
矩陣 A 的更高冪的行為方式相同:乘以 A^n 會(huì)導(dǎo)致特征從 n 跳距離節(jié)點(diǎn)傳播,所以可以通過將乘法添加到鄰接矩陣的更高次方來擴(kuò)展“感受野”。為了概括這一操作,可以將節(jié)點(diǎn)更新的函數(shù)定義為具有某些權(quán)重 w 的此類乘法之和:
多項(xiàng)式圖卷積濾波器。A——圖鄰接矩陣,w——標(biāo)量權(quán)重,x——初始節(jié)點(diǎn)特征,x'——更新節(jié)點(diǎn)特征。
新特征 x' 是來自 n 跳距離的節(jié)點(diǎn)的某種混合,相應(yīng)距離的影響由權(quán)重 w 控制。這樣的操作可以被認(rèn)為是一個(gè)圖卷積,濾波器 P 由權(quán)重 w 參數(shù)化。與圖像上的卷積類似,圖卷積濾波器也可以具有不同的感受野并聚合有關(guān)節(jié)點(diǎn)鄰居的信息,但鄰居的結(jié)構(gòu)不像圖像中的卷積核那樣規(guī)則。
這樣的多項(xiàng)式與一般卷積一樣是置換等變性的??梢允褂脠D拉普拉斯算子而不是鄰接矩陣來傳遞特征差異而不是節(jié)點(diǎn)之間的特征值(也可以使用標(biāo)準(zhǔn)化的鄰接矩陣)。
將圖卷積表示為多項(xiàng)式的能力可以從一般的譜圖卷積( spectral graph convolutions)中推導(dǎo)出來。例如,利用帶有圖拉普拉斯算子的切比雪夫多項(xiàng)式的濾波器提供了直接譜圖卷積的近似值 [1]。
并且可以輕松地將其推廣到具有相同方程的節(jié)點(diǎn)特征的任何維度上。但在更高維度的情況下,處理的是節(jié)點(diǎn)特征矩陣 X 而不是節(jié)點(diǎn)特征向量。例如,對(duì)于 N 個(gè)節(jié)點(diǎn)和節(jié)點(diǎn)中的 1 或 M 個(gè)特征,我們得到:
x——節(jié)點(diǎn)特征向量,X——堆疊節(jié)點(diǎn)特征,M——節(jié)點(diǎn)特征向量的維度,N——節(jié)點(diǎn)數(shù)量。
可以將特征向量的“深度”維度視為圖像卷積中的“通道”。
現(xiàn)在用另外一種不同的方式看看上面的討論。繼續(xù)采用上面討論的一個(gè)簡單的多項(xiàng)式卷積,只有兩個(gè)第一項(xiàng),讓 w 等于 1:
現(xiàn)在如果將圖特征矩陣 X 乘以 (I + A) 可以得到以下結(jié)果:
對(duì)于每個(gè)節(jié)點(diǎn),都添加了相鄰節(jié)點(diǎn)的總和。因此該操作可以表示如下:
N(i) 表示節(jié)點(diǎn) i 的一跳距離鄰居。
在這個(gè)例子中,“update”和“aggregate”只是簡單的求和函數(shù)。
這種關(guān)于節(jié)點(diǎn)特征更新被稱為消息傳遞機(jī)制。這樣的消息傳遞的單次迭代等效于帶有過濾器 P= I + A 的圖卷積。那么如果想從更遠(yuǎn)的節(jié)點(diǎn)傳播信息,我們可以再次重復(fù)這樣的操作幾次,從而用更多的多項(xiàng)式項(xiàng)逼近圖卷積。
但是需要注意的是:如果重復(fù)多次圖卷積,可能會(huì)導(dǎo)致圖過度平滑,其中每個(gè)節(jié)點(diǎn)嵌入對(duì)于所有連接的節(jié)點(diǎn)都變成相同的平均向量。
那么如何增強(qiáng)消息傳遞的表達(dá)能力?可以嘗試聚合和更新函數(shù),并額外轉(zhuǎn)換節(jié)點(diǎn)特征:
W1——更新節(jié)點(diǎn)特征的權(quán)重矩陣,W2——更新相鄰節(jié)點(diǎn)特征的權(quán)重矩陣。
可以使用任何排列不變函數(shù)進(jìn)行聚合,例如 sum、max、mean 或更復(fù)雜的函數(shù),例如 DeepSets。
例如,評(píng)估消息傳遞的基本方法之一是 GCN 層:
第一眼看到這個(gè)公式可能并不熟悉,但讓我們使用“更新”和“聚合”函數(shù)來看看它:
使用單個(gè)矩陣 W 代替兩個(gè)權(quán)重矩陣 W1 和 W2。更新函數(shù)是求和,聚合函數(shù)是歸一化節(jié)點(diǎn)特征的總和,包括節(jié)點(diǎn)特征 i。d——表示節(jié)點(diǎn)度。
這樣就使用一個(gè)權(quán)重矩陣 W 而不是兩個(gè),并使用 Kipf 和 Welling 歸一化求和作為聚合,還有一個(gè)求和作為更新函數(shù)。聚合操作評(píng)估鄰居和節(jié)點(diǎn) i 本身,這相當(dāng)于將自循環(huán)( self-loops)添加到圖中。
所以具有消息傳遞機(jī)制的 GNN 可以表示為多次重復(fù)的聚合和更新函數(shù)。消息傳遞的每次迭代都可以被視為一個(gè)新的 GNN 層。節(jié)點(diǎn)更新的所有操作都是可微的,并且可以使用可以學(xué)習(xí)的權(quán)重矩陣進(jìn)行參數(shù)化?,F(xiàn)在我們可以構(gòu)建一個(gè)圖卷積網(wǎng)絡(luò)并探索它是如何執(zhí)行的。
使用上面提到的 GCN 層構(gòu)建和訓(xùn)練圖神經(jīng)網(wǎng)絡(luò)。對(duì)于這個(gè)例子,我將使用 PyG 庫和 [2] 中提供的 AIDS 圖數(shù)據(jù)集。它由 2000 個(gè)代表分子化合物的圖表組成:其中 1600 個(gè)被認(rèn)為對(duì) HIV 無活性,其中 400 個(gè)對(duì) HIV 有活性。每個(gè)節(jié)點(diǎn)都有一個(gè)包含 38 個(gè)特征的特征向量。以下是數(shù)據(jù)集中分子圖表示的示例:
使用 networkx 庫可視化來自 AIDS 數(shù)據(jù)集的樣本。
為簡單起見,我們將構(gòu)建一個(gè)只有 3 個(gè) GCN 層的模型。嵌入空間可視化的最終嵌入維度將是 2-d。為了獲得圖嵌入,將使用均值聚合。為了對(duì)分子進(jìn)行分類,將在圖嵌入之后使用一個(gè)簡單的線性分類器。
具有三個(gè) GCN 層、平均池化和線性分類器的圖神經(jīng)網(wǎng)絡(luò)。
對(duì)于第一次消息傳遞的迭代(第 1 層),初始特征向量被投影到 256 維空間。在第二個(gè)消息傳遞期間(第 2 層),特征向量在同一維度上更新。在第三次消息傳遞(第 3 層)期間,特征被投影到二維空間,然后對(duì)所有節(jié)點(diǎn)特征進(jìn)行平均以獲得最終的圖嵌入。最后,這些嵌入被輸送到線性分類器。選擇二維維度只是為了可視化,更高的維度肯定會(huì)更好。這樣的模型可以使用 PyG 庫來實(shí)現(xiàn):
from torch import nn
from torch.nn import functional as F
from torch_geometric.nn import GCNConv
from torch_geometric.nn import global_mean_pool
class GCNModel(nn.Module):
def __init__(self, feature_node_dim=38, num_classes=2, hidden_dim=256, out_dim=2):
super(GCNModel, self).__init__()
torch.manual_seed(123)
self.conv1 = GCNConv(feature_node_dim, hidden_dim)
self.conv2 = GCNConv(hidden_dim, hidden_dim)
self.conv3 = GCNConv(hidden_dim, out_dim)
self.linear = nn.Linear(out_dim, num_classes)
def forward(self, x, edge_index, batch):
# Graph convolutions with nonlinearity:
x = self.conv1(x, edge_index)
x = F.relu(x)
x = self.conv2(x, edge_index)
x = F.relu(x)
x = self.conv3(x, edge_index)
# Graph embedding:
x_embed = global_mean_pool(x, batch)
# Linear classifier:
x = self.linear(x_embed)
return x, x_embed
在其訓(xùn)練期間,可以可視化圖嵌入和分類器決策邊界。可以看到消息傳遞操作如何使僅使用 3 個(gè)圖卷積層的生成有意義的圖嵌入的。這里使用隨機(jī)初始化的模型嵌入并沒有線性可分分布:
上圖是對(duì)隨機(jī)初始化的模型進(jìn)行正向傳播得到的分子嵌入
但在訓(xùn)練過程中,分子嵌入很快變成線性可分:
即使是 3 個(gè)圖卷積層也可以生成有意義的二維分子嵌入,這些嵌入可以使用線性模型進(jìn)行分類,在驗(yàn)證集上具有約 82% 的準(zhǔn)確度。
在本文中介紹了圖卷積如何表示為多項(xiàng)式,以及如何使用消息傳遞機(jī)制來近似它。這種具有附加特征變換的方法具有強(qiáng)大的表示能力。本文中僅僅觸及了圖卷積和圖神經(jīng)網(wǎng)絡(luò)的皮毛。圖卷積層和聚合函數(shù)有十幾種不同的體系結(jié)構(gòu)。并且在圖上能夠完成的任務(wù)任務(wù)也很多,如節(jié)點(diǎn)分類、邊緣重建等。所以如果想深入挖掘,PyG教程是一個(gè)很好的開始。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
電氣符號(hào)相關(guān)文章:電氣符號(hào)大全
萬用表相關(guān)文章:萬用表怎么用
可控硅相關(guān)文章:可控硅工作原理
手機(jī)電池相關(guān)文章:手機(jī)電池修復(fù)
pa相關(guān)文章:pa是什么
晶體管相關(guān)文章:晶體管工作原理
電荷放大器相關(guān)文章:電荷放大器原理 晶體管相關(guān)文章:晶體管原理 調(diào)速器相關(guān)文章:調(diào)速器原理