新聞中心

EEPW首頁 > 智能計(jì)算 > 市場分析 > 買一萬張芯片,造一個新帝國

買一萬張芯片,造一個新帝國

作者: 時(shí)間:2023-04-26 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 收藏

曾與其他業(yè)界大佬共同發(fā)出暫停 GPT-4 以上的大型語言人工智能模型的開發(fā)聲明,但隨后卻成立了新的 公司,并采購了上萬張 NVIDIA 最新的 加速卡,開始發(fā)展自己的 GPT 人工智能模型。這讓人們感到困惑,不知道在想什么。甚至被業(yè)界質(zhì)疑是不是想要拖慢 Open 的發(fā)展腳步好讓自己可以取而代之?

本文引用地址:http://2s4d.com/article/202304/446027.htm

基本上,發(fā)展的 AI 都是為了服務(wù)人類的創(chuàng)意,并取代重復(fù)的人類工作,但隨著 ChatGPT 的推出,創(chuàng)意和邏輯這塊很快就被 AI 取代了一大部分,馬斯克在這時(shí)創(chuàng)立 X.AI,并且要推出「真實(shí)」的 GPT 模型,也讓人懷疑,馬斯克這是在打臉自己?然而事情并不是那么單純…

當(dāng)然,馬斯克與 OpenAI 之間的恩怨已經(jīng)有很多人談過,他們之間的是非對錯其實(shí)也很難三言兩語就解釋清楚,因此我們這次就來了解馬斯克在 AI 這條路上做了什么,以及以后他藉由 X.AI 來做什么,然后來嘗試解答馬斯克創(chuàng)立 X.AI 公司的目的。

廣被誤解的自動駕駛

先從馬斯克的 AI 發(fā)展歷程稍微回顧一下,馬斯克最早投入 AI 議題是從自動駕駛技術(shù)開始,早在 2014 年時(shí),特斯拉開始在其 Model S 上引入最早的一代 Autopilot 技術(shù),隨后也推廣至 Model X 車種,當(dāng)時(shí)這個系統(tǒng)雖然號稱自動駕駛,但實(shí)際上汽車無法自行決定路線、方向,也無法判斷路況,只能進(jìn)行簡單的車道置中以及變換車道,雖好于目前的 L2 駕駛輔助,但仍遠(yuǎn)遠(yuǎn)談不上自動駕駛。

當(dāng)然,自動駕駛被誤解其實(shí)也是中文翻譯的問題,比如說飛機(jī)上的 AutoPilot 其實(shí)也是翻譯成自動駕駛,但實(shí)際上,飛機(jī)的自動駕駛也只是在固定的高度維持飛行,而不是可以從起飛、航線變換到降落都可以交給飛機(jī)。不過當(dāng)時(shí)的汽車產(chǎn)業(yè)界對其所謂自動駕駛的定義非??燎?,認(rèn)為以特斯拉當(dāng)時(shí)的 AutoPilot 功能,根本稱不上自動,特斯拉也因此飽受責(zé)難。

加上當(dāng)時(shí)選用的硬件是基于 Mobileye 的 ASIC 方案,性能非常弱,即便后續(xù)更新軟件,也沒辦法滿足消費(fèi)者的需求。

因此,馬斯克后來在 2016 年結(jié)束語 Mobileye 的合作,轉(zhuǎn)而與 NVIDIA 進(jìn)行合作。眾所周知,NVIDIA 在 2010 年左右開始發(fā)展其 CUDA 與 GPGPU 生態(tài),并借此推動人工智能的發(fā)展,隨后也以 Tegra 方案為基礎(chǔ)推出自動駕駛方案。

NVIDIA 的自動駕駛方案的確強(qiáng)大許多,但仍遠(yuǎn)不及馬斯克心中的想像,加上后續(xù)的中國電動車企業(yè)小鵬爆發(fā)用 AutoPilot 原始碼并與 NVIDIA 進(jìn)行合作的爭議之后,特斯拉隨即結(jié)束與 NVIDIA 的合作關(guān)系,并轉(zhuǎn)而自行研發(fā)真正的自動駕駛平臺。

而馬斯克也重新定義自動駕駛的英文名稱,將其稱為 FSD(Full Self Drive),不在名稱上走擦邊球,馬斯克信心滿滿,覺得在 2020 年就能推出全功能的 FSD 正式版,但截至目前為止,F(xiàn)SD 仍處在測試版階段,目前最新版本是 Beta 11.4。

FSD Beta 徹底翻轉(zhuǎn)以往自駕車邏輯,采用新空間占量概念(Occupancy Network),不再以連續(xù)單張圖片為基礎(chǔ),而是以物體體積的影片為基礎(chǔ)運(yùn)算,克服許多自駕技術(shù)困難,無需光達(dá)、雷達(dá)和高精地圖,以純視覺就能做到極接近人類駕駛的程度。雖然還有些小瑕疵,但在業(yè)界也已經(jīng)是表現(xiàn)最好的自動駕駛系統(tǒng)。

那么 FSD 是如何被打造出來的?我們可以分為兩個部分來看,一個是汽車上的推理核心,負(fù)責(zé)現(xiàn)場駕駛行為的判斷與執(zhí)行,另一個是云端的訓(xùn)練工作,負(fù)責(zé)從個別的特斯拉汽車收集駕駛資訊,并以之訓(xùn)練精進(jìn) FSD 的駕駛模型。

汽車上的推理芯片由特斯拉自行研發(fā),命名為 Hardware x.0,目前版號已經(jīng)到 4.0,由三星代工生產(chǎn),基于 Exynos 手機(jī)芯片架構(gòu)改造。總運(yùn)算性能達(dá)到 490TOPS,超越 NVIDIA 最新自動駕駛平臺 Driver Orin 的 254TOPS。

而云端的部分也有不小的變革。原本特斯拉是采用 NVIDIA 的 GPU 來打造自有的超級電腦,并以之訓(xùn)練自動駕駛模型,該超級電腦使用了 7360 顆 NVIDIA 的 A100 運(yùn)算芯片,在 2022 年底可以排上全球第七強(qiáng)超級電腦。

透過此超級電腦,特斯拉已經(jīng)可以做到道路物件的標(biāo)記完全自動化,并且能夠更快的基于特斯拉回傳的駕駛資訊訓(xùn)練改進(jìn)駕駛模型。然后馬斯克也就辭退了之前為特斯拉工作的 800 名標(biāo)記師。

不過 NVIDIA 的方案顯然還是無法滿足特斯拉,同樣是在 2022 年,特斯拉在 AI Day 上公布了 Dojo 計(jì)劃,包含 Dojo 視覺訓(xùn)練芯片以及超級電腦叢集 ExaPod,預(yù)計(jì)在 2023 年上線,屆時(shí)將是性能高達(dá) 1.1 EFLOP 的恐怖怪物級超級電腦,性能是現(xiàn)有基于 GPU 架構(gòu)超級電腦的 4 倍以上。

超級工廠與 AI

除了特斯拉電動車以外,用來造車的超級工廠也同樣高度 AI 化,尤其大型產(chǎn)線機(jī)器人,幾乎都已經(jīng)全面自動化,這些機(jī)器人可以執(zhí)行復(fù)雜的操作,甚至在有需要時(shí)可以自動變換工具來執(zhí)行不同的組裝任務(wù),因此,特斯拉的產(chǎn)能不斷獲得提升,成本也不斷下降。

特斯拉表示,超級工廠雖然還有數(shù)千名員工,但整合 AI 機(jī)器人之后,工作流程可以由軟件定義、訓(xùn)練、最佳化,極大的改善了制造流程。

而超級工廠下一步,則是要引進(jìn)在 2022 年發(fā)表的特斯拉 Optimus 人形機(jī)器人,透過這個機(jī)器人,可以大量取代需要使用到人工的重復(fù)性工作。該機(jī)器人基本上就是一個人形化的特斯拉汽車,其處理器、電池還有許多電機(jī)技術(shù),都是來自特斯拉。

充電一次就可以工作一整天。馬斯克表示,最快在 2023 年內(nèi)進(jìn)行量產(chǎn),并引進(jìn)超級工廠。馬斯克表示,就如同特斯拉的自動駕駛系統(tǒng)是要用來代替人類執(zhí)行重復(fù)且無聊的駕駛工作,Optimus 也是要用來代替人類進(jìn)行日常購物、清掃、搬運(yùn)等重復(fù)性工作。

新公司 X.AI 回歸 NVIDIA

既然特斯拉已經(jīng)有能力發(fā)展自己的超級電腦芯片與超級電腦叢集,那為何馬斯克的新 AI 公司仍采購近萬顆 NVIDIA 最新的 H100 芯片來建立資料中心?答案其實(shí)很簡單,那就是特斯拉自有的 Dojo 芯片主要是針對視覺處理工作而設(shè)計(jì),軟件框架較為固定,沒有辦法像 NVIDIA 在提供高彈性的同時(shí),也具備高性能。

同時(shí),X.AI 公司要發(fā)展的是類似 OpenAI 的 ChatGPT,這類大型自然語言模型的訓(xùn)練工作還是 NVIDIA 的強(qiáng)項(xiàng)。完整版 H100 芯片能達(dá)到 60TFLOPS 的 FP32 運(yùn)算能力,D1 則僅為 22TFLOPS,不過 D1 支援特斯拉自訂的 CFP8 浮點(diǎn)格式,比較擅長用于自家的駕駛模型訓(xùn)練工作。

而如果根據(jù)新聞訊息,X.AI 采購了一萬張 H100 演算卡,那么初期 X.AI 的運(yùn)算能力是超越算出 GPT4 的 OpenAI 所使用的上萬張 A100,因?yàn)榫图兇庑阅?,H100 是 A100 的 4 倍以上。

也就是說,如果馬斯克要訓(xùn)練出一個 GPT4 等級的 AI 模型,那么理論上性能是綽綽有余的。不過 OpenAI 背后還有微軟這個大金主存在,OpenAI 除了自身擁有內(nèi)建上萬張 A100 的超級電腦以外,還有微軟 Azure 具備的運(yùn)算力,包含超過一萬張基于 A100 加速卡的超級電腦叢集,專門服務(wù) ChatGPT,以及已經(jīng)采購的超過 7000 張的 H100,將會用來建立新的演算力來服務(wù) GPT4 或未來的 GPT5,OpenAI 負(fù)責(zé)訓(xùn)練,而微軟這邊則是主要提供讓 ChatGPT 可以連接到微軟旗下應(yīng)用的龐大推理能力,當(dāng)然,微軟也有可能出借部分運(yùn)算能力給 OpenAI 以供其訓(xùn)練模型之用。

馬斯克的目的是什么?

那么回過頭來看,馬斯克的 X.AI 想要服務(wù)的是哪些客戶?想要達(dá)到的是哪些目的?從過去馬斯克的作法來看,他一直利用 AI 來取代偏勞力類型的人類工作,但是 ChatGPT 是要取代人類的部分思想與思考能力,讓人腦專注于創(chuàng)意以及設(shè)定工作目標(biāo),專業(yè)知識與工作流程則是由 ChatGPT 來代勞,所以馬斯克也要學(xué) OpenAI +微軟,開始要搶某些白領(lǐng)工作了?

不過馬斯克強(qiáng)調(diào),他的模型將會專注于真相的傳達(dá),不要有偏見,也不要有限制。然而沒有限制的 AI 聽起來似乎更危險(xiǎn)?完全中立似乎也是另外一種偏見?

對此,由馬斯克所招募,擔(dān)任 X.AI 核心技術(shù)研發(fā)與管理的前 DeepMind 與 OpenAI 研發(fā)工程師伊戈?duì)枴ぐ筒际步穑↖gor Babuschkin)表示,他們更重視語言模型的推理能力與真實(shí)性,比如說 GPT3.5/4 都會在某些程度上虛構(gòu)答案,而且這些模型還無法解釋為什么要給出特定的答案,因?yàn)檫壿嫸疾卦?AI 模型的黑盒子中。

如果 X.AI 所研發(fā)的模型能夠具備更好的邏輯推論與分辨事實(shí)的能力,那是不是也要將人類目前所能擔(dān)任的指示、監(jiān)督與核實(shí) AI 所產(chǎn)生的內(nèi)容的工作也剝奪走,未來的 AI 將可以全自動根據(jù)其觀察到的現(xiàn)況設(shè)定目標(biāo)、解決問題,不需要人類插手,而且也不用怕會像 GPT3.5/4 一樣會自欺欺人,造成潛在的災(zāi)難?

那不是比 ChatGPT 更危險(xiǎn)嗎?對此,馬斯克其實(shí)還留有一手,他認(rèn)為,如果打不過 AI,那么就加入它,讓大腦透過 NeuraLink 連接電腦/ AI,一起協(xié)同工作,透過強(qiáng)化人類大腦,來讓 AI 無法取代,或者,讓大腦本身變成 AI 的一部份。

Neuralink 目前還在實(shí)驗(yàn)階段,但是進(jìn)展相當(dāng)快速,根據(jù)實(shí)驗(yàn)結(jié)果,已經(jīng)能夠讓猴子進(jìn)行超越人類反應(yīng)的電腦操作。不過 Neuralink 目前還有不少包括倫理上的爭議,以及技術(shù)上的困難,要普及恐怕有點(diǎn)困難,但等到大型語言模型普及,甚至可以完全自主的 AI 模型出現(xiàn),屆時(shí)人類可能也沒有太多選擇了?



關(guān)鍵詞: 馬斯克 AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉