Achronix宣布即日推出用于人工智能/機(jī)器學(xué)習(xí)和網(wǎng)絡(luò)硬件加速應(yīng)用的第四代Speedcore eFPGA IP

作者：時(shí)間：2018-12-04 來(lái)源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

2018年12月4日，基于現(xiàn)場(chǎng)可編程門(mén)陣列（FPGA）的硬件加速器器件和高性能嵌入式FPGA半導(dǎo)體知識(shí)產(chǎn)權(quán)（eFPGA IP）領(lǐng)導(dǎo)性企業(yè)Achronix半導(dǎo)體公司今天宣布：即日起推出其第四代嵌入式FPGA產(chǎn)品Speedcore?Gen4 eFPGA IP，以支持客戶將FPGA功能集成到他們的SoC之中。與之前一代的Speedcore 嵌入式FPGA（eFPGA）產(chǎn)品相比，Speedcore Gen4將性能提高了60％、功耗降低了50％、芯片面積減少65％，新的機(jī)器學(xué)習(xí)處理器（MLP）單元模塊為人工智能/機(jī)器學(xué)習(xí)（AI / ML）應(yīng)用提供高出300％的性能，同時(shí)保留了原有的Speedcore eFPGA IP的功能，即可將可編程硬件加速功能引入廣泛的計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用，實(shí)現(xiàn)接口協(xié)議橋接/轉(zhuǎn)換、算法加速和數(shù)據(jù)包處理。

本文引用地址：http://2s4d.com/article/201812/395220.htm

在Speedcore Gen4架構(gòu)中，Achronix將機(jī)器學(xué)習(xí)處理器（MLP）添加到Speedcore可提供的資源邏輯庫(kù)單元模塊中。MLP模塊是一種高度靈活的計(jì)算引擎，它與存儲(chǔ)器緊密耦合，從而為人工智能和機(jī)器學(xué)習(xí)（AI / ML）應(yīng)用提供了性能/功耗比最高和成本最低的解決方案。

Achronix 半導(dǎo)體公司總裁兼首席執(zhí)行官Robert Blake說(shuō)道：“Achronix是第一家向SoC開(kāi)發(fā)公司提供量產(chǎn)eFPGA IP的公司，使他們能夠創(chuàng)建支持各種全新應(yīng)用的可編程數(shù)據(jù)加速器。新的Speedcore Gen4 eFPGA架構(gòu)提供了以前僅在ASIC中才能實(shí)現(xiàn)的、最佳的硬件加速平衡，以及我們經(jīng)過(guò)量產(chǎn)驗(yàn)證過(guò)的FPGA技術(shù)提供的靈活性和可編程性，從而為新興人工智能/機(jī)器學(xué)習(xí)和高數(shù)據(jù)帶寬應(yīng)用的爆炸式需求提供了支持?！?/p>

Robert補(bǔ)充到：“我們正在使用經(jīng)過(guò)驗(yàn)證的同樣的方法體系來(lái)為客戶提供最新的Speedcore Gen4 eFPGA技術(shù)，來(lái)滿足他們將eFPGA IP的所有優(yōu)勢(shì)和靈活性與增強(qiáng)的人工智能/機(jī)器學(xué)習(xí)功能相結(jié)合的愿望，而這種最前沿的人工智能/機(jī)器學(xué)習(xí)功能得益于我們最新機(jī)器學(xué)習(xí)處理器單元模塊和臺(tái)積電（TSMC）最先進(jìn)的7nm工藝技術(shù)?！?/p>

解決帶寬爆炸問(wèn)題

固定和無(wú)線網(wǎng)絡(luò)帶寬的急劇增加，加上處理能力向邊緣等進(jìn)行重新分配，以及數(shù)十億物聯(lián)網(wǎng)設(shè)備的出現(xiàn)，將給傳統(tǒng)網(wǎng)絡(luò)和計(jì)算基礎(chǔ)設(shè)施帶來(lái)壓力。這種新的處理范式意味著每秒將有數(shù)十億到數(shù)萬(wàn)億次的運(yùn)算。傳統(tǒng)云和企業(yè)數(shù)據(jù)中心計(jì)算資源和通信基礎(chǔ)設(shè)施無(wú)法跟上數(shù)據(jù)速率的指數(shù)級(jí)增長(zhǎng)、快速變化的安全協(xié)議、以及許多新的網(wǎng)絡(luò)和連接要求。傳統(tǒng)的多核CPU和SoC無(wú)法在沒(méi)有輔助的情況下獨(dú)立滿足這些要求，因而它們需要硬件加速器，通常是可重新編程的硬件加速器，用來(lái)預(yù)處理和卸載計(jì)算，以便提高系統(tǒng)的整體計(jì)算性能。經(jīng)過(guò)優(yōu)化后的Speedcore Gen4 eFPGA已經(jīng)可以滿足這些應(yīng)用需求。

Speedcore Gen4是最佳的人工智能/機(jī)器學(xué)習(xí)加速器

除了計(jì)算和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的通用要求之外，人工智能/機(jī)器學(xué)習(xí)還對(duì)高密度和針對(duì)性計(jì)算產(chǎn)生了顯著增加的需求。與以前的Achronix FPGA產(chǎn)品相比，新的Achronix機(jī)器學(xué)習(xí)處理器（MLP）利用了人工智能/機(jī)器學(xué)習(xí)處理的特定屬性，并將這些應(yīng)用的性能提高了300％。這是通過(guò)多種架構(gòu)性創(chuàng)新來(lái)實(shí)現(xiàn)的，這些創(chuàng)新可以同時(shí)提高每個(gè)時(shí)鐘周期的性能和操作次數(shù)。

新的Achronix機(jī)器學(xué)習(xí)處理器（MLP）是一個(gè)完整的人工智能/機(jī)器學(xué)習(xí)計(jì)算引擎，支持定點(diǎn)和多個(gè)浮點(diǎn)數(shù)格式和精度。每個(gè)機(jī)器學(xué)習(xí)處理器包括一個(gè)循環(huán)寄存器文件（Cyclical Register File），它用來(lái)存儲(chǔ)重用的權(quán)重或數(shù)據(jù)。各個(gè)機(jī)器學(xué)習(xí)處理器與相鄰的機(jī)器學(xué)習(xí)處理器單元模塊和更大的存儲(chǔ)單元模塊緊密耦合，以提供最高的處理性能、每秒最高的操作次數(shù)和最低的功率分集。這些機(jī)器學(xué)習(xí)處理器支持各種定點(diǎn)和浮點(diǎn)格式，包括Bfloat16、16位、半精度、24位和單元塊浮點(diǎn)。用戶可以通過(guò)為其應(yīng)用選擇最佳精度來(lái)實(shí)現(xiàn)精度和性能的均衡。

為了補(bǔ)充機(jī)器學(xué)習(xí)處理器并提高人工智能/機(jī)器學(xué)習(xí)的計(jì)算密度，Speedcore Gen4查找表（LUT）可以實(shí)現(xiàn)比任何獨(dú)立FPGA芯片產(chǎn)品高出兩倍的乘法器。領(lǐng)先的獨(dú)立FPGA芯片在21個(gè)查找表可以中實(shí)現(xiàn)6x6乘法器，而Speedcore Gen4僅需在11個(gè)LUT中就可實(shí)現(xiàn)相同的功能，并可在1 GHz的速率上工作。

架構(gòu)性創(chuàng)新提高系統(tǒng)性能

與上一代Speedcore產(chǎn)品相比，新的Speedcore Gen4架構(gòu)實(shí)現(xiàn)了多項(xiàng)創(chuàng)新，從而可將系統(tǒng)整體性能提高60％。其中查找表的所有方面都得到了增強(qiáng)，以支持使用最少的資源來(lái)實(shí)現(xiàn)各種功能，從而可縮減面積和功耗并提高性能。其中的更改包括將ALU的大小加倍、將每個(gè)LUT的寄存器數(shù)量加倍、支持7位函數(shù)和一些8位函數(shù)、以及為移位寄存器提供的專用高速連接。

其中的路由架構(gòu)也借由一種獨(dú)立的專用總線路由結(jié)構(gòu)得到了增強(qiáng)。此外，在該路由結(jié)構(gòu)中還有專用的總線多路復(fù)用器，可有效地創(chuàng)建分布式的、運(yùn)行時(shí)可配置的交換網(wǎng)絡(luò)。這為高帶寬和低延遲應(yīng)用提供了最佳的解決方案，并在業(yè)界首次實(shí)現(xiàn)了將網(wǎng)絡(luò)優(yōu)化應(yīng)用于FPGA互連。

如何評(píng)估Speedcore Gen4

Achronix的ACE設(shè)計(jì)工具中包括了Speedcore Gen4 eFPGAs的預(yù)先配置示例實(shí)例，它們可支持客戶針對(duì)性能、資源使用率和編譯時(shí)間去評(píng)估Speedcore Gen4的結(jié)果質(zhì)量；Achronix現(xiàn)已可提供支持Speedcore Gen4的ACE設(shè)計(jì)工具。Speedcore采用了一種模塊化的架構(gòu)，它可根據(jù)客戶的要求輕松配置其大小。Achronix使用其Speedcore Builder工具來(lái)即刻創(chuàng)建新的Speedcore實(shí)例，以便滿足客戶對(duì)其快速評(píng)估的要求。

新聞中心

Achronix宣布即日推出用于人工智能/機(jī)器學(xué)習(xí)和網(wǎng)絡(luò)硬件加速應(yīng)用的第四代Speedcore eFPGA IP

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)