服務(wù)熱線
0755-83044319
發(fā)布時間:2024-05-07作者來源:薩科微瀏覽:968
IT之家 5 月 4 日消息,上周召開的臺積電(TSMC)北美技術(shù)研討會上,特斯拉表示專門用于訓(xùn)練 AI 的晶圓級 Dojo 處理器已經(jīng)投入量產(chǎn),距離部署已經(jīng)不遠了。
特斯拉的 Dojo 晶圓上系統(tǒng)(system-on-wafer)處理器(特斯拉官方稱其為 Dojo Training Tile)采用 5*5 陣列共計 25 顆芯片,這些芯片放置在載體晶圓上,然后使用臺積電的集成扇出(InFO)技術(shù)進行晶圓級互連(InFO_SoW)互連。
據(jù) IEEE Spectrum 報道,InFO_SoW 技術(shù)旨在實現(xiàn)高性能連接,讓特斯拉 Dojo 的 25 個芯片可以像 1 個處理器一樣工作;同時為了讓晶圓級處理器保持一致,臺積電用虛擬芯片填充了芯片之間的空白點。
特斯拉晶圓級 Dojo 處理器實際上包含了 25 個超高性能處理器,耗電量非常高,因此需要復(fù)雜的冷卻系統(tǒng)。
特斯拉為了滿足 Dojo 處理器的供電需求,使用復(fù)雜的電壓調(diào)節(jié)模塊,為計算平面提供 18000 安培的電力,散發(fā)的熱量高達 15000W,因此需要水冷散熱。
特斯拉尚未透露其 Dojo 晶圓系統(tǒng)的性能 —— 不過,考慮到其開發(fā)過程中面臨的所有挑戰(zhàn),它似乎有望成為人工智能訓(xùn)練的一個非常強大的解決方案。IT之家附上相關(guān)圖片如下:
晶圓級處理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圓級引擎 (WSE),比多處理器機器的性能效率要高得多。它們的主要優(yōu)點包括內(nèi)核之間的高帶寬和低延遲通信、降低的電力傳輸網(wǎng)絡(luò)阻抗以及卓越的能源效率。此外,這些處理器可以受益于擁有冗余的“額外”核心 —— 或者,對于特斯拉來說,擁有已知良好的處理器核心。
特斯拉的Dojo處理器是專門為人工智能訓(xùn)練設(shè)計的晶圓級處理器,具有以下顯著特點:
1. 高集成度:Dojo處理器采用5x5陣列,共計25顆芯片,這些芯片放置在載體晶圓上,并使用臺積電的集成扇出(InFO)技術(shù)進行晶圓級互連(InFO_SoW)。
2. 高性能連接:InFO_SoW技術(shù)旨在實現(xiàn)高性能連接,讓25個芯片可以像1個處理器一樣協(xié)同工作。
3. 高耗電與冷卻需求:由于Dojo處理器耗電量非常高,因此需要復(fù)雜的冷卻系統(tǒng),特斯拉為此設(shè)計了專門的電壓調(diào)節(jié)模塊和水冷散熱系統(tǒng)。
4. 專用于AI計算:Dojo核心具有類似CPU的風(fēng)格,比GPU更能適應(yīng)不同的算法和分支代碼,并且具有專注于加速AI計算的自定義向量指令。
5. 存算一體架構(gòu):D1芯片采用存算一體架構(gòu),運行在2GHz,擁有巨大的440MB SRAM,提供近存計算的優(yōu)勢。
6. RISC-V架構(gòu)參:D1處理器的指令集參考了RISC-V架構(gòu),并自定義了一些指令,特別是矢量計算相關(guān)的指令。
7. 高算力密度:Dojo核心提供了1.024TFLOPS的算力,且?guī)缀跛械乃懔Χ加删仃囉嬎銌卧峁?br style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;"/>
8. 數(shù)據(jù)流近存計算架構(gòu):D1處理器擁有分布式SRAM,通過大量更快更近的片上存儲減少對內(nèi)存的訪問頻度,提升系統(tǒng)性能。
9. 高帶寬和低延遲:Dojo處理器的NoC網(wǎng)絡(luò)可以處理跨節(jié)點邊界的數(shù)據(jù)同步,提供高帶寬和低延遲的通信。
10. 定制化架構(gòu):Dojo是一套完全可定制的架構(gòu),全面涵蓋計算、網(wǎng)絡(luò)、輸入/輸出(I/O)芯片。
11. 潛力巨大:據(jù)分析,Dojo有潛力為特斯拉增加巨額市值,特別是在移動和網(wǎng)絡(luò)服務(wù)方面的應(yīng)用。
12. 先進封裝技術(shù):Dojo訓(xùn)練模塊采用先進的InFO_SoW封裝技術(shù),提高芯片間的互連密度。
13. 高性能計算:Dojo處理器由臺積電制造,采用7納米工藝,擁有500億個晶體管,芯片面積為645mm2,小于業(yè)界同類產(chǎn)品。
這些特點使得特斯拉的Dojo處理器在人工智能訓(xùn)練領(lǐng)域具有潛在的高性能和高效率,有望成為AI計算的強大解決方案。
免責(zé)聲明:本文原創(chuàng)作者張國斌,本文僅代表作者個人觀點,不代表薩科微及行業(yè)觀點,只為轉(zhuǎn)載與分享,支持保護知識產(chǎn)權(quán),轉(zhuǎn)載請注明原出處及作者,如有侵權(quán)請聯(lián)系我們刪除。
友情鏈接:站點地圖 薩科微官方微博 立創(chuàng)商城-薩科微專賣 金航標(biāo)官網(wǎng) 金航標(biāo)英文站
Copyright ?2015-2024 深圳薩科微半導(dǎo)體有限公司 版權(quán)所有 粵ICP備20017602號-1