IEEE:識別深度偽造
僅在2024年上半年,IEEE Xplore數(shù)字圖書館就發(fā)表了300多篇專注于為深度偽造創(chuàng)建檢測工具的文章。
IEEE高級會員Aiyappan Pillai表示:“在人工智能使深度造假算法能夠制造出更難檢測的贗品的同時,人工智能檢測技術也在通過采用不同的技術和算法來識別偽造品。”
什么是深度偽造?
深度偽造一詞是兩個術語的混合: 深度學習和偽造。深度偽造是人工智能生成的逼真視頻、音頻片段或靜止圖像,描繪了真實的人做或說他們沒有做過提過的事情。近年來,這種深度偽造出現(xiàn)在了政治領域,同時也影響了娛樂界。深度偽造可能會通過模仿流行音樂行為的歌曲來擾亂娛樂經(jīng)濟,而這些歌曲通常未經(jīng)表演者授權。
新興檢測方法
目前存在兩大類技術用于識別深度偽造,并且已經(jīng)進行了大量研究來確定它們的工作效果。
· 機器學習: 識別深度偽造的一種方法是向機器學習模型提供大量深度偽造和真實內(nèi)容,以便它能夠學習發(fā)現(xiàn)它們之間的差異。這些技術可能根本不涉及機器視覺。相反,它們將圖像轉換為數(shù)據(jù),并從其模式中學習。如果一個新的深度偽造與訓練的數(shù)據(jù)有顯著差異,那么這種方法的一個挑戰(zhàn)可能是難以識別它。
· 語義分析: 與依賴原始數(shù)據(jù)的機器學習方法相比,語義分析使用與幫助人工智能系統(tǒng)識別圖片中的蘋果或書籍相同的機器視覺技術來查看圖像的內(nèi)容和上下文。這些方法可以分析說話者面部的血流模式、頭部的形狀,或者他們的外表是否隨著時間的推移而保持一致。語義分析還涵蓋了沒有意義的對象之間的關系。例如,想象一個浴室的建筑渲染。人工智能生成的圖像可能會將淋浴頭放置在無法正常使用的位置。
數(shù)字水印
識別深度偽造的需要導致一些生成性人工智能公司為此目的創(chuàng)建標記。在某些情況下,用戶可以看到這些標記;在其他情況下則相反。
IEEE高級會員Rahul Vishwakarma說:“檢測深度偽造最有效的技術之一是使用生成式AI平臺對生成的圖像進行數(shù)字水印?!?/span>
偏見問題
大約有五六個常用的數(shù)據(jù)集——人的視頻和圖像——被用來訓練深度學習模型來檢測深度偽造。一個數(shù)據(jù)集完全由名人組成。研究人員面臨的一個挑戰(zhàn)是,這些數(shù)據(jù)集中的人更有可能是白人和男性。這引發(fā)了人們對深度偽造檢測工具在面對來自不同背景的人的數(shù)據(jù)時是否會遇到困難的質疑。
人類或許表現(xiàn)更好嗎?
雖然深度偽造是真實的,但人類可以發(fā)現(xiàn)它們。最近發(fā)表在IEEE Privacy & Security上的一項研究將人類與機器對立起來。研究人員發(fā)現(xiàn),平均而言,人類能夠識別大約71%的深度偽造,而尖端的檢測方法能夠識別93%。
然而,一些深度偽造圖像欺騙了檢測算法,但人類能夠發(fā)現(xiàn)騙局。
有些人比其他人更善于發(fā)現(xiàn)深度偽造,但研究人員才剛剛開始研究原因。在另一項研究中,研究人員考察了警察和“超級識別者(super-recognizers)”檢測深度假貨的能力。超級識別者的能力得到了實驗室的認證,他們是真正擅長識別和辨認人臉的人。研究表明,超級識別者在識別深度偽造方面并不比普通人好。這表明,能夠判斷某物是否是深度偽造與善于識別人臉不同。
評論