新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 告別視頻通話“渣畫質(zhì)”，英偉達(dá)新算法最高壓縮90%流量

告別視頻通話“渣畫質(zhì)”，英偉達(dá)新算法最高壓縮90%流量

作者：時間：2020-12-02 來源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

為了讓網(wǎng)速慢的用戶用上高清通話，英偉達(dá)可謂絞盡腦汁。他們開發(fā)的新AI算法，可以將視頻通話的流量最高壓縮90%以上。

本文引用地址：http://2s4d.com/article/202012/420822.htm

　　

　　和其他視頻相比，通話的場景比較單一，基本上只有人的頭部在運動。因此只要能把頭像數(shù)據(jù)大規(guī)模壓縮，就能大大節(jié)約流量。

　　

　　英偉達(dá)的新算法face vid2vid正是從這一點出發(fā)。只要一張圖片，就能實現(xiàn)重建各種頭部姿勢圖片。

　　H.264視頻所需的帶寬是這種新算法的2~12倍，從前面的演示也能看出，如果讓二者使用相同比特率，那么H.264視頻幾乎不可用。

　　

　　轉(zhuǎn)動面部不扭曲

　　英偉達(dá)提供了一個試用Demo，可以在Pitch（俯仰角）、Yaw（偏航角）、Roll（翻滾角）三個方向上任意旋轉(zhuǎn)。

　　

　　輸入一張人臉，最多可以在每個方向上最多旋轉(zhuǎn)30度。以下是三個方向上旋轉(zhuǎn)到最大角度生成的圖片。

　　

　　與相比之前的方法，英偉達(dá)的這種技術(shù)即使在面部轉(zhuǎn)動幅度較大時，人臉也不會扭曲變形。

　　

　　然而，圖片終究是不動的，要把生成的人臉放在運動的視頻中還要多一個步驟。

　　合成面部視頻

　　我們把上傳的清晰照片作為源圖像，從中獲取外貌特征。然后把視頻中一幀幀畫面作為重構(gòu)視頻的依據(jù)，從中提取出面部表情和頭部姿勢等信息。

　　而表情和姿勢這兩個數(shù)據(jù)可以通過關(guān)鍵點進(jìn)行編碼，這樣就分離了人物身份信息和運動信息。在傳輸視頻時只要有運動信息即可，從而節(jié)約了流量。

　　

　　從源圖像s中，我們得到了兩組數(shù)據(jù)：關(guān)鍵點坐標(biāo)x和雅可比矩陣J。這兩組參數(shù)與面部的具體特征無關(guān)，只包含人的幾何特征。

　　其中，雅可比矩陣表示如何通過仿射變換將關(guān)鍵點周圍的局部補丁轉(zhuǎn)換為另一幅圖像中的補丁。如果是恒等雅可比矩陣，則補丁將直接復(fù)制并粘貼到新位置。

　　

　　下圖展示了計算前5個關(guān)鍵點的流程。給定源圖像以及模型預(yù)測的規(guī)范關(guān)鍵點。

　　

　　從運動視頻估計的旋轉(zhuǎn)和平移應(yīng)用于關(guān)鍵點，帶動頭部姿勢的變化。然后可以感知表情的變形將關(guān)鍵點調(diào)整為目標(biāo)表情。

　　接下來開始合成視頻。使用源和運動的關(guān)鍵點與其雅可比矩陣來估計流wk，從生成流組合成掩碼m，將這兩組進(jìn)行線性組合即可產(chǎn)生合成流場w。

　　

　　接著輸入人臉面部特征f，即可生成輸出圖像y。

　　這種方法不僅能用于視頻通話，也有其他“新玩法”。

　　比如覺得人物頭像有點歪，可以手動輸入糾正后的數(shù)據(jù)，從而將面部轉(zhuǎn)正。

　　

　　又或者是，把一個人的面部特征點和雅可比矩陣用于另一個人，實現(xiàn)面部視頻動作的遷移。

　　

　　團(tuán)隊簡介

　　這篇文章的第一作者是來自英偉達(dá)的高級研究員Ting-Chun Wang。

　　

　　文章的通訊作者是英偉達(dá)的著名研究員劉洺堉。

　　

　　如果你長期關(guān)注CV領(lǐng)域，一定對這兩位作者非常熟悉。他們在圖像風(fēng)格遷移、GAN等方面做出了大量的工作。

　　

　　△ GauGAN

　　兩人之前已經(jīng)有過多次合作。比如。無監(jiān)督圖像遷移網(wǎng)絡(luò)（NIPS 2017），還有從涂鴉生成照片的GauGAN（CVPR 2019），都是出自這二位之手。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達(dá) 算法

評論

相關(guān)推薦

英偉達(dá)GB300回歸Bianca設(shè)計

英偉達(dá) GB300 Bianca Cordelia | 2025-05-29

大嘴業(yè)話——ARM再次上市，究竟7年時間算不算被偷走的？（2）

視頻 AI 英偉達(dá) ARM | 2023-11-07

基于LPC2138的血壓測量算法開發(fā)平臺電路圖

設(shè)計方案基于 LPC2138 血壓測量算法開發(fā)平臺電路圖 | 2010-01-20

有關(guān)指紋算法

wsf999 | 2004-08-06

無線傳感器網(wǎng)絡(luò)低功耗分簇路由算法設(shè)計

設(shè)計方案無線傳感器網(wǎng)絡(luò) 功耗路由算法設(shè)計 | 2012-09-07

[轉(zhuǎn)帖]us/os就緒表的維護(hù)算法分析

amine | 2002-05-17

英偉達(dá)全新中國特供版GPU要來了？據(jù)傳售價將大幅低于H20

智能計算英偉達(dá) 特供版 GPU H20 | 2025-05-26

PID算法

資源下載 PID 算法誤差 | 2007-02-16

數(shù)字PID控制及其改進(jìn)算法的應(yīng)用

設(shè)計方案數(shù)字控制及其改進(jìn) 算法應(yīng)用 | 2011-05-11

求FSK信號的解調(diào)算法，主要是鐵路上的移頻信號!

dhlwq007 | 2004-08-04

《E點冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達(dá) GPU CUDA AI | 2024-03-26

CRC算法原理及C語言實現(xiàn)

資源下載 CRC 算法 C語言 | 2007-02-16

英偉達(dá)推動 Ada 和 SPARK 進(jìn)入無人駕駛汽車

汽車電子英偉達(dá) 自動駕駛 Ada | 2025-06-05

GPU的形態(tài)已徹底改變，英偉達(dá)GTC大會發(fā)布的到底是什么

視頻英偉達(dá) GPU Blackwell AI GTC | 2024-03-26

利用元學(xué)習(xí)保持無人機飛行控制系統(tǒng)在正確的軌道上

機器人機器人算法無人機 | 2025-06-11

目標(biāo)跟蹤算法在紅外熱成像跟蹤技術(shù)上的應(yīng)用

設(shè)計方案目標(biāo) 跟蹤算法紅外成像技術(shù)上應(yīng)用 | 2009-09-03

大嘴業(yè)話——ARM再次上市，究竟7年時間算不算被偷走的？（1）

視頻英偉達(dá) 嵌入式 ARM 軟銀 | 2023-11-06

英偉達(dá)新款中國特供芯片：放棄Cowos封裝和HBM

英偉達(dá) 芯片 Cowos 封裝 HBM | 2025-05-27

計算機科學(xué)與技術(shù)反思錄(2)

liujt_ic | 2003-06-06

從95%到50%：黃仁勛的焦慮另有原因

智能計算英偉達(dá) GPU 人工智能 | 2025-05-22

簡單實用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

三星恐以拆分搶臺積電訂單想讓蘋果、英偉達(dá)變心

EDA/PCB 三星臺積電蘋果英偉達(dá) | 2025-05-29

英媒：符合美國監(jiān)管要求背景下，英偉達(dá)擬再推“中國特供”芯片

智能計算英偉達(dá) 特供芯片人工智能 | 2025-05-26

vxwokrs下靜態(tài)圖像壓縮算法（上）

C-- | 2004-07-26

科技巨頭深化臺積電和臺產(chǎn)業(yè)鏈合作

EDA/PCB 臺積電英偉達(dá) 聯(lián)發(fā)科 AMD 高通 | 2025-05-22

大嘴業(yè)話——英偉達(dá)宣布進(jìn)軍CPU市場

視頻英偉達(dá) AI CPU | 2023-11-10

采用Mean-Shift和Camshift算法相結(jié)合的火焰視頻圖像跟蹤設(shè)計

設(shè)計方案采用 Mean-Shift Camshift 算法相結(jié)合 | 2011-06-27

英偉達(dá)CSO：美國AI禁令讓中國搶走大量AI研發(fā)人才

英偉達(dá) AI | 2025-06-10

數(shù)字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

焦點

推薦視頻

技術(shù)專區(qū)