博客專欄

EEPW首頁(yè) > 博客 > 李彥宏10年花了1000多億!500萬(wàn)開(kāi)發(fā)者撐起中國(guó)最大深度學(xué)習(xí)框架

李彥宏10年花了1000多億!500萬(wàn)開(kāi)發(fā)者撐起中國(guó)最大深度學(xué)習(xí)框架

發(fā)布人:傳感器技術(shù) 時(shí)間:2023-01-11 來(lái)源:工程師 發(fā)布文章
【導(dǎo)讀】一年一度的百度Create大會(huì)又來(lái)了,還是一如既往地酷炫、硬核!


當(dāng)你仰望星空時(shí),你在想些什么?

有執(zhí)著的發(fā)問(wèn),就會(huì)有不曾想象的回音。


從方寸之間到寰宇之外,創(chuàng)造新宇宙的人,相信永遠(yuǎn)看不到天花板。


堅(jiān)定的人,不會(huì)因?yàn)榈竭_(dá)而停下,他們用創(chuàng)造的腳步丈量未知。


百度CREATE 2022大會(huì),為我們展示了人類設(shè)計(jì)師和AIGC共同創(chuàng)意制作的繪畫(huà)。

而就像這些繪畫(huà)所描述的場(chǎng)景,百度,也不曾停下創(chuàng)新的腳步。

在大會(huì)開(kāi)始,李彥宏就提出了一個(gè)令人深思的觀點(diǎn):第四次科技革命的標(biāo)志,就是深度學(xué)習(xí)算法。與深度學(xué)習(xí)相關(guān)的重大創(chuàng)新,會(huì)像汽車、互聯(lián)網(wǎng)一樣,對(duì)我們的社會(huì)產(chǎn)生重大的影響。

圖片

真正的實(shí)踐中,沒(méi)有導(dǎo)航地圖,只有指南針。而百度,也是摸準(zhǔn)大致方向后,基于實(shí)踐一步步迭代,才跑出了有價(jià)值的創(chuàng)新。

在大會(huì)上,李彥宏展示了這樣一幅畫(huà)。這幅畫(huà)是他以「危機(jī)和希望」為關(guān)鍵詞,在百度AI作畫(huà)平臺(tái)一格上生成的。


這幅畫(huà),很好地代表了人工智能面臨的現(xiàn)狀——經(jīng)歷起起落落,但充滿希望。

是的,李彥宏依然堅(jiān)持去年的觀點(diǎn)——?jiǎng)?chuàng)造者們將迎來(lái)屬于人工智能的黃金十年。

AIGC元年,來(lái)了

2022,AIGC全面爆發(fā)。

DALL·E2讓文本生成圖片火爆一整年,隨后的Stable Diffussion、Midjourney,更是啟發(fā)了無(wú)數(shù)人的藝術(shù)靈感,甚至讓不少畫(huà)手感到震驚。

而DALL·E2和谷歌發(fā)布的Imagen的模型,也吸引了許多AI學(xué)者參與研究。

ChatGPT雖然到了年末才壓軸出場(chǎng),但「強(qiáng)化學(xué)習(xí)」賦予它的魔力,讓它在全民狂歡中再次掀起AIGC的風(fēng)暴。

圖片

其實(shí),在2022年初,百度研究院早已預(yù)測(cè)到了AIGC在這一年的火爆。

超大規(guī)模預(yù)訓(xùn)練模型呈現(xiàn)知識(shí)增強(qiáng)、跨模態(tài)統(tǒng)一建模、多學(xué)習(xí)方式共同演進(jìn)的趨勢(shì),并逐漸實(shí)用化。


例如AIGC (AI generated content,人工智能創(chuàng)造內(nèi)容),借助大模型的跨模態(tài)綜合技術(shù)能力,可以激發(fā)創(chuàng)意,提升內(nèi)容多樣性,降低制作成本,將會(huì)實(shí)現(xiàn)大規(guī)模應(yīng)用。

而且,這已經(jīng)不是百度研究院第一次做出神預(yù)測(cè)了。2020年,它預(yù)測(cè)的NLP模型在GPT-3上得到應(yīng)驗(yàn),而在2021年,它押中的數(shù)字人全面大爆。

而這次,百度對(duì)于AIGC領(lǐng)域的趨勢(shì),可謂是胸有成竹。

三個(gè)天才創(chuàng)作者,一鍵圓你導(dǎo)演夢(mèng)

在Create 2022大會(huì)上,百度幾乎將AIGC深入應(yīng)用到了每一個(gè)環(huán)節(jié)。歌曲、場(chǎng)景、演講腦圖的創(chuàng)作,這些環(huán)節(jié)中,全都有AI的參與。

???

而李彥宏以「危機(jī)和希望」為主題生成的繪畫(huà),背后就是文心知識(shí)增強(qiáng)跨模態(tài)大模型一格,它就是接下來(lái)要出場(chǎng)的三位天才創(chuàng)作者的其中一位。

這次Create大會(huì)上,百度技術(shù)委員會(huì)主席吳華為我們介紹了三位能力超群的天才創(chuàng)作者。

它們分別是天才編劇——文心ERNIE3.0Zeus,天才插畫(huà)師——文心ERNIE-ViLG 2.0,剪輯和動(dòng)畫(huà)大師——VIMER-TCIR。

圖片

有了這三位天才創(chuàng)作者,再配上自己設(shè)計(jì)的虛擬人演員,你也可以當(dāng)上導(dǎo)演,拍出自己的影視大作了!

文心ERNIE 3.0 Zeus語(yǔ)言大模型,陪你聊到天荒地老!

作為ERNIE 3.0系列模型的最新升級(jí),ERNIE 3.0 Zeus除了對(duì)無(wú)標(biāo)注數(shù)據(jù)和知識(shí)圖譜的學(xué)習(xí)之外,還通過(guò)持續(xù)學(xué)習(xí)對(duì)百余種不同形式的任務(wù)數(shù)據(jù)實(shí)現(xiàn)了全面掌握。

在對(duì)通用知識(shí)和專門(mén)知識(shí)「雙管齊下」后,模型的泛化能力顯著提升,不管是多語(yǔ)言理解,還是生成任務(wù),都能輕松搞定,名副其實(shí)的「通才」了屬于是。

無(wú)論是自主創(chuàng)作、自由回答,還是命題對(duì)話、情感分析,100多個(gè)層次化Prompt,ERNIE 3.0 Zeus都能順利應(yīng)對(duì)。

圖片

文心ERNIE-ViLG 2.0圖像生成大模型,天才畫(huà)師了解一下?

如果說(shuō)文心ERNIE 3.0 Zeus是語(yǔ)言大師,ERNIE-ViLG 2.0就是作畫(huà)大師。它能根據(jù)一句話或者一段描述文本,生成一幅精美的畫(huà)作。

圖片

中文提示,想要什么畫(huà),直接開(kāi)口說(shuō)就行,只有你想不到的,沒(méi)有ta畫(huà)不出來(lái)的,看看這艘青花瓷戰(zhàn)艦,像不像一尊精美的藝術(shù)品?就是不知道真的打起來(lái),會(huì)不會(huì)被一炮干碎......

而要達(dá)成這個(gè)目標(biāo),離不開(kāi)模型本身背后知識(shí)增強(qiáng)的擴(kuò)散模型。

一句話或幾句話的提示中,哪些是核心要素,需要在畫(huà)作中突出展現(xiàn),哪些是修飾要素,作用就是錦上添花,還不能喧賓奪主,這里邊就有學(xué)問(wèn)了。

圖片

為了盡可能實(shí)現(xiàn)精準(zhǔn)作畫(huà),在學(xué)習(xí)過(guò)程中,ERNIE ViLG 2.0引入了語(yǔ)言、視覺(jué)等多源知識(shí),引導(dǎo)模型更加關(guān)注文本和圖像中的核心語(yǔ)義元素,實(shí)現(xiàn)精準(zhǔn)的細(xì)粒度語(yǔ)義控制。

此外,ERNIE ViLG 2.0還可以針對(duì)不同階段,選擇不同網(wǎng)絡(luò)(比如降噪)建模的框架,有效解決了不同階段對(duì)模型能力要求不一致的問(wèn)題,減少了降噪任務(wù)的互相干擾,提升了圖像生成的質(zhì)量。

圖片

無(wú)論是寫(xiě)實(shí)風(fēng)、中國(guó)風(fēng)、還是國(guó)潮、國(guó)畫(huà)風(fēng),ERNIE-ViLG 2.0都能根據(jù)簡(jiǎn)短的中文提示生成切題、風(fēng)格各異、且生動(dòng)逼真的圖像。

圖片

舉個(gè)例子,比如下面這段艷麗飄逸的「天宮盛宴」:

基于ERNIE-ViLG 2.0的文心·一格,交出了可以說(shuō)是面面俱到的作業(yè),整體畫(huà)風(fēng)色調(diào)明艷,不失古代情調(diào)。


現(xiàn)在,我們只需要在百度「文心·一格」平臺(tái)上輸入幾個(gè)關(guān)鍵詞,也能分分鐘得到風(fēng)格獨(dú)特的畫(huà)作。

除了語(yǔ)言和圖像外,在視頻內(nèi)容生成與編輯上,也是文心大模型大展身手的地方。

在視覺(jué)內(nèi)容生成方面,視頻生成大模型可以根據(jù)用戶提供的一段描述文本,或者一幅圖像,自動(dòng)地生成高清、流暢的視頻。

圖片

在視覺(jué)編輯方面,VIMER-TCIR多任務(wù)大模型,則可以利用對(duì)超分辨率、去噪、去模糊、去壓縮等多任務(wù)的聯(lián)合預(yù)訓(xùn)練,同時(shí)實(shí)現(xiàn)對(duì)多種不同情況的修復(fù)和編輯。

目前,VIMER-TCIR已經(jīng)在老電影修復(fù)等場(chǎng)景實(shí)現(xiàn)落地,而且大幅提升了運(yùn)行效率,每天單機(jī)就可修復(fù)視頻28.5萬(wàn)幀,解決了絕大部分老電影畫(huà)面的修復(fù)問(wèn)題。

圖片

AIGC的浪潮已經(jīng)到來(lái),在未來(lái),可以預(yù)見(jiàn)的是,AI作畫(huà)、AI創(chuàng)作視頻等等,很快就會(huì)變得像手機(jī)拍照一樣簡(jiǎn)單。

隨著技術(shù)的不斷突破,AIGC將很有可能顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,實(shí)現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,創(chuàng)造出有獨(dú)特價(jià)值和獨(dú)立視角的內(nèi)容。

研發(fā)資金拉滿:10年投入超1000億

為了讓大模型達(dá)到如此酷炫的效果,百度在研發(fā)方面,可謂是毫不吝嗇。

十年間累計(jì)投入了超過(guò)1000億元,其中核心研發(fā)投入占核心收入比例連續(xù)8個(gè)季度超過(guò)了20%。

據(jù)統(tǒng)計(jì),百度在2020年的研發(fā)投入強(qiáng)度為18.22%,位列民營(yíng)企業(yè)500強(qiáng)第一。2021年為20.03%,位列民營(yíng)企業(yè)500強(qiáng)第二。

圖片

順便一提的是,如此「豪橫」的投入,也讓百度在人工智能的底層技術(shù)方面,取得了領(lǐng)先優(yōu)勢(shì)。

畢竟,****脖子要緊,基礎(chǔ)軟件卡脖子也一樣要緊。

早在2016年,百度就開(kāi)始研發(fā)被稱為「人工智能操作系統(tǒng)」的深度學(xué)習(xí)框架——飛槳。

目前,已經(jīng)凝聚了535萬(wàn)開(kāi)發(fā)者,創(chuàng)建了67萬(wàn)個(gè)模型,構(gòu)建起一個(gè)繁榮的深度學(xué)習(xí)生態(tài)。

基于飛槳的大模型也可以有效集成自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等多模態(tài)能力,并聯(lián)合多種行業(yè)務(wù)場(chǎng)景進(jìn)行調(diào)優(yōu);而開(kāi)發(fā)者也能像搭積木一樣構(gòu)建AI應(yīng)用,大大降低AI的應(yīng)用門(mén)檻。

圖片

李彥宏:人工智能的黃金十年

文章開(kāi)頭我們已經(jīng)提到,李彥宏認(rèn)為,與深度學(xué)習(xí)相關(guān)的重大創(chuàng)新,包括自動(dòng)駕駛、水電能等領(lǐng)域的智能調(diào)度系統(tǒng)等,會(huì)產(chǎn)生重大社會(huì)影響。

創(chuàng)新本身是從何而來(lái)呢?在李彥宏看來(lái),創(chuàng)新,是由反饋驅(qū)動(dòng)的。

百度在經(jīng)營(yíng)發(fā)展中,就有很多「反饋驅(qū)動(dòng)創(chuàng)新」的實(shí)踐經(jīng)驗(yàn)。比如,百度昆侖芯片之所以在AI芯片中擁有領(lǐng)先的性能,正是因?yàn)樗呀?jīng)為百度的搜索服務(wù)優(yōu)化了十年。

百度的搜索服務(wù),每天響應(yīng)幾十億次真實(shí)的用戶使用需求,每天進(jìn)行1萬(wàn)億次深度語(yǔ)義推理與匹配,能夠提供最真實(shí)、最及時(shí)的反饋,從而倒逼大模型、深度學(xué)習(xí)框架和芯片的優(yōu)化。

現(xiàn)在,百度是全球?yàn)閿?shù)不多的、進(jìn)行全棧布局的人工智能公司(芯片層、框架層、模型層和應(yīng)用層)。


從高端芯片昆侖,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,各個(gè)層面都有關(guān)鍵自研技術(shù),每一層之間都有很多反饋,通過(guò)不斷獲得反饋,實(shí)現(xiàn)端到端優(yōu)化。

每一層的技術(shù)架構(gòu),都是越往下越通用,越往上越專用。

而人工智能越專用,就越能深入產(chǎn)業(yè),賦能實(shí)體經(jīng)濟(jì)發(fā)展。

去年的Create大會(huì)上,李彥宏曾預(yù)言:「隨著技術(shù)應(yīng)用門(mén)檻不斷降低,創(chuàng)造者們將迎來(lái)屬于人工智能的黃金10年?!谷缃?,他依舊這樣認(rèn)為。


李彥宏剛剛創(chuàng)業(yè)時(shí),互聯(lián)網(wǎng)泡沫破裂,全世界蒸發(fā)8萬(wàn)億市值,而后不久,互聯(lián)網(wǎng)再次進(jìn)入黃金十年,而人工智能,也會(huì)經(jīng)歷同樣的起起落落。

而百度,將一如既往為社會(huì)、為產(chǎn)業(yè)培養(yǎng)AI人才,投入更多資源,與各位開(kāi)發(fā)者們一道,為中國(guó)AI的發(fā)展盡最大的努力。

彩蛋

Create大會(huì)最后,虛擬人樂(lè)隊(duì)成員們?cè)俅蔚菆?chǎng)。

圖片主唱/吉他:希加加,鼓手:度曉曉,貝斯:葉悠悠,鍵盤(pán):林開(kāi)開(kāi)

希加加表示,自己的畫(huà)能在大會(huì)開(kāi)場(chǎng)被展示,實(shí)在是太開(kāi)心了!

而林開(kāi)開(kāi)過(guò)了把當(dāng)制作人的癮,他開(kāi)心自夸道,自己還挺有編曲天賦的~

葉悠悠說(shuō),自己的設(shè)計(jì)居然長(zhǎng)在大家的審美點(diǎn)上,這讓她相當(dāng)滿意。那么,哪個(gè)環(huán)節(jié)的設(shè)計(jì)是她做的呢?


度曉曉猜對(duì)了:是「知一」和「千流」環(huán)節(jié)。


而度曉曉表示,自己早已寫(xiě)好了發(fā)布會(huì)的傳播稿。


在四位成員的共同頭腦風(fēng)暴中,稿件的標(biāo)題火熱出爐——《震驚!這是一場(chǎng)人和機(jī)器一起辦的大會(huì)》。

圖片

對(duì)此小編表示:新媒體文章標(biāo)題的精髓,被你們拿捏了圖片。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

土壤濕度傳感器相關(guān)文章:土壤濕度傳感器原理


關(guān)鍵詞: 李彥宏

技術(shù)專區(qū)

關(guān)閉