- +1
Jim Keller :做與英偉達(dá)完全相反的事情

本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自eetimes
RISC-V正在發(fā)揮更大的價(jià)值。
Tenstorrent 已開始發(fā)售其用于 AI 工作負(fù)載的 Blackhole 處理器。首席執(zhí)行官 Jim Keller 表示,這是四年來最好的一天。
在Keller位于加州圣克拉拉的辦公室門外,有一塊白板,上面用粗體字寫著“我們一定會贏!”。旁邊列出了一些在黑洞一代硬件上達(dá)到“實(shí)用”性能和可靠性水平的模型,其中包括目前公司TT-NN編譯器堆棧中列出的五個(gè)模型。“我們還有15個(gè)模型正在開發(fā)中,”他說。
負(fù)責(zé)構(gòu)建基于 Tenstorrent MLIR(多級中間表示)編譯器的團(tuán)隊(duì) TT-Forge 稍微落后了一點(diǎn),但 Keller 表示“目前有數(shù)百名工程師正在致力于此”。

“MLIR 真的是一個(gè)重大勝利,”Keller說?!斑@是一個(gè)不錯(cuò)的選擇,真的很棒。”
Keller 對為開源項(xiàng)目 MLIR 做出貢獻(xiàn)感到特別興奮。Tenstorrent 的整個(gè)軟件棧都是開源的。“這個(gè)決定在公司內(nèi)部和外部都得到了好評,而且它幫助我們招募人才,因?yàn)殚_源精神對工程師很有吸引力,”他說。
“我們在很多方面都獲得了關(guān)注,因?yàn)槿藗兡軌蚧谖覀兊募夹g(shù)構(gòu)建軟件,而且他們?yōu)槲覀儦g呼,因?yàn)樗行?,而且我們可以對其進(jìn)行調(diào)整。他們對真正的開源軟件棧的存在感到興奮,”Keller 說。
RISC-V投資
Tenstorrent 的芯片和 IP 也基于開源指令集 RISC-V 構(gòu)建。Keller 表示:“RISC-V 行業(yè)的決策速度曾讓我們感到畏懼,但現(xiàn)在我們在某些領(lǐng)域已經(jīng)處于領(lǐng)先地位?!?/p>
“我們正在投資 RISC-V 編譯器技術(shù)。我們已經(jīng)將 LLVM 的性能提高了 10%,并且為開源做出了貢獻(xiàn)。操作系統(tǒng)、驅(qū)動程序、工具鏈,一切都在改進(jìn)。RISC-V 真的很棒,我很高興我們做出了正確的決策,并且能夠從中受益,”Keller 說道。
“AI 代碼生成將會改變代碼。它將更加傾向于并行化,CPU 架構(gòu)也在發(fā)生變化。其他 ISA 無法控制這一點(diǎn),但 RISC-V 可以,所以我們正在積極地致力于此,”Keller 說。
NVIDIA 近期宣布,將把其用于 GPU 之間通信的互連技術(shù)“NVIDIA NVLink”的 IP 授權(quán)給部分定制 CPU 和加速器制造商。該公司以自主研發(fā)而聞名,但一些人認(rèn)為此舉旨在圍繞部分 NVIDIA 技術(shù)構(gòu)建多供應(yīng)商生態(tài)系統(tǒng)。當(dāng)被問及是否對更開放的 NVLink 版本有任何擔(dān)憂時(shí),Keller 回答說:“我一點(diǎn)也不擔(dān)心?!?/p>
Keller說:“Tenstorrent 芯片通過經(jīng)過驗(yàn)證的開放標(biāo)準(zhǔn)以太網(wǎng)連接,這已經(jīng)足夠了。”
他開玩笑說:“我們把NVIDIA做的事情列個(gè)清單,然后反其道而行之。以太網(wǎng)真的很棒。小型低成本芯片是個(gè)好主意。更簡單的服務(wù)器很棒,開源軟件也很棒?!?/p>
他還強(qiáng)調(diào)了 Tenstorrent 對更便宜的芯片封裝的關(guān)注,放棄高帶寬內(nèi)存 (HBM) 而選擇 GDDR6。
Keller說:“如果你完全照搬領(lǐng)先者的做法,你將獲得 20% 的市場份額,但你會降低價(jià)格,而且你不會創(chuàng)造出新的市場?!?/p>
“至少有一家公司正在自己的AI硬件中使用Tenstorrent的開源堆棧。這家中國公司提交了一份錯(cuò)誤報(bào)告,Tenstorrent團(tuán)隊(duì)順利修復(fù)了該錯(cuò)誤。這就是開源軟件的本質(zhì),即使它可能幫助了中國的競爭對手制造商,”他說。
勝利是靠創(chuàng)新贏得的
“Tenstorrent 將繼續(xù)服務(wù)中國市場。根據(jù)目前的美國出口限制,我們上一代硬件 Wormhole 可以運(yùn)往中國,但 Blackhole 必須進(jìn)行精簡,我們正在將這種精簡融入到每一塊硅片中。Ascalon CPU IP 也必須針對中國客戶進(jìn)行精簡,”Keller 說道。
“限制人工智能技術(shù)的出口對美國沒有好處,”Keller說?!跋拗瓢雽?dǎo)體設(shè)備的出口意味著中國將加大國內(nèi)人工智能技術(shù)的研發(fā)力度?!?/p>
“據(jù)我所知,過去五年中國對半導(dǎo)體設(shè)備的限制,反而加速了中國的發(fā)展速度大約五年,”Keller說道?!皠倮强縿?chuàng)新贏得的,而不是靠限制。這一點(diǎn)早已顯而易見?!?/p>
Tenstorrent 目前在塞爾維亞、德國和波蘭設(shè)有歐洲辦事處,并應(yīng)塞浦路斯政府的邀請?jiān)谌致匪归_設(shè)辦事處,將使用 Tenstorrent 計(jì)算機(jī)與塞浦路斯大學(xué)開展合作項(xiàng)目。
“各國都希望掌控自己的人工智能技術(shù),而不是依賴美國的超級巨頭,”Keller說,“他們喜歡我們的開源軟件,這樣他們就可以自己做事?!?/p>
Keller表示:“我們未來可能設(shè)立辦事處的國家之一是西班牙,因?yàn)槟抢镉写罅颗c RISC-V 相關(guān)的人才和政府支持?!?/p>
在日本,Tenstorrent 也正在與 Rapidus 合作,后者的 2nm 中試線正在啟動中,并且剛剛提前發(fā)布了 PDK(工藝設(shè)計(jì)套件)。
“我們一直在對一些 CPU 進(jìn)行綜合測試,并向它們發(fā)送反饋,”Keller 說,“測試結(jié)果基本符合我們的預(yù)期?!?/p>
構(gòu)建更大的訓(xùn)練集群
隨著 Blackhole 芯片的推出,Tenstorrent 正在繼續(xù)構(gòu)建更大規(guī)模的訓(xùn)練集群。目前,他們已經(jīng)構(gòu)建了一個(gè)由 6 個(gè)“Backhole Galaxies ”(192 個(gè)芯片)組成的訓(xùn)練集群,并計(jì)劃在未來六個(gè)月內(nèi)實(shí)現(xiàn)更大的集群。他們的最終目標(biāo)是打造一個(gè)包含 16 臺 Galaxy 服務(wù)器的數(shù)據(jù)平面引擎。其中 16 臺 Galaxy 服務(wù)器用于交換(Tenstorrent 使用自有芯片作為交換機(jī)),另外 16 臺 Galaxy 服務(wù)器用作優(yōu)化器,并保留一定的冗余度。
“在演示中,我們將運(yùn)行一個(gè)集群,并展示即使拔掉任何線纜,它也不會停止運(yùn)行,”Keller說?!霸瓌t上,你可以關(guān)閉任何服務(wù)器的電源,它都會繼續(xù)運(yùn)行?!?/p>
他進(jìn)一步指出,“四臺 Galaxies(128 塊芯片)即可實(shí)現(xiàn)快速推理。推理所需的令牌數(shù)量將是現(xiàn)有大規(guī)模語言 (LLM) 工作負(fù)載的百萬倍以上(推理計(jì)算量的實(shí)際上限取決于人類能夠提出的獨(dú)特問題的數(shù)量)。”
“我的使命是大幅降低訓(xùn)練成本,”Keller強(qiáng)調(diào)?!拔覀?nèi)绾翁峁┖线m的平臺來做新的事情?這是一個(gè)巨大的挑戰(zhàn),因?yàn)槿绻悴荒苡?xùn)練,你就無法做新的事情?!?/p>
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請聯(lián)系后臺。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




