AI芯片再出新性能怪獸 Tesla V100憑什么要價(jià)百萬

作者：時(shí)間：2017-05-15 來源：艾媒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　據(jù)國外媒體VentureBeat報(bào)道，英偉達(dá)CEO黃仁勛昨天發(fā)布了一款針對(duì)人工智能應(yīng)用的雄心勃勃的新處理器：Tesla V100。

本文引用地址：http://2s4d.com/article/201705/359138.htm

　　該新芯片擁有210億個(gè)晶體管，性能比英偉達(dá)一年前發(fā)布的帶150億個(gè)晶體管的Pascal處理器強(qiáng)大得多。它是一款很大的芯片——815平方毫米，大小約為Apple Watch智能手表的表面。它擁有5120個(gè)CUDA(統(tǒng)計(jì)計(jì)算設(shè)備架構(gòu))處理核心，雙精度浮點(diǎn)運(yùn)算性能可達(dá)每秒7.5萬億次。

　　作為全球最大的圖形芯片和AI芯片廠商，總部位于加州圣克拉拉的英偉達(dá)在加州圣何塞舉行GPU技術(shù)大會(huì)，并發(fā)布了上述產(chǎn)品。

　　黃仁勛稱Nvidia總共投入了30億美元來打造這款產(chǎn)品。黃仁勛在發(fā)布這款產(chǎn)品時(shí)顯得非常激動(dòng)，稱Tesla V100的研發(fā)是一項(xiàng)幾乎不可能完成的任務(wù)，令人難以置信。

　　接下來，黃仁勛通過一系列視頻及游戲展示了Tesla V100怪獸級(jí)的性能。那些曾經(jīng)在Titan X上需要數(shù)分鐘才能處理完成的任務(wù)，在Tesla V100上只需要花數(shù)秒就能完成。

　　此外，基于8塊Tesla V100搭建的DGX-1也開始預(yù)售，價(jià)格為149000美元(合100萬人民幣)，預(yù)計(jì)在今年第三季度交付。

　　在介紹該款芯片之前，黃仁勛談到了AI近年的發(fā)展史。他指出，深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)研究大約5年前開始帶來成果，那個(gè)時(shí)候研究人員開始利用圖形處理器(CPU)來處理數(shù)據(jù)，同時(shí)利用它們來快速訓(xùn)練神經(jīng)網(wǎng)絡(luò)。自那時(shí)起，深度學(xué)習(xí)技術(shù)呈現(xiàn)加速發(fā)展。今年，英偉達(dá)打算培訓(xùn)10萬個(gè)開發(fā)者使用該項(xiàng)技術(shù)。

　　Tesla V100另稱為Volta，針對(duì)深度學(xué)習(xí)而打造，Tensor性能可達(dá)每秒120萬億次浮點(diǎn)運(yùn)算。它能夠每秒傳輸300GB的數(shù)據(jù)，速度相當(dāng)于時(shí)下其它處理器的20倍。該款芯片由三星代工生產(chǎn)。

　　該芯片針對(duì)深度學(xué)習(xí)訓(xùn)練的Tensor浮點(diǎn)運(yùn)算性能達(dá)到去年發(fā)布的Pascal處理器的12倍。這種處理速度很有必要，因?yàn)樯疃葘W(xué)習(xí)算法的進(jìn)展令人驚嘆。

　　2015年，微軟打造了一個(gè)名為ResNet的深度學(xué)習(xí)項(xiàng)目，該項(xiàng)目非常復(fù)雜，需要每秒7百億億次浮點(diǎn)運(yùn)算的處理能力。百度2016年打造的Deep Speech 2 AI需要每秒20百億億次浮點(diǎn)運(yùn)算的處理能力，谷歌2017年打造的NMT則需要每秒105百億億次浮點(diǎn)運(yùn)算的處理能力。

　　微軟正在開發(fā)一個(gè)新的ResNet版本，ResNet會(huì)同時(shí)使用64個(gè)Tesla V100芯片來進(jìn)行處理。目前還不清楚Tesla V100批量出貨的時(shí)間。

新聞中心

AI芯片再出新性能怪獸 Tesla V100憑什么要價(jià)百萬

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)