訂閱
糾錯
加入自媒體

叫停5個月后,特斯拉Dojo超算“換芯”歸來

作者 | 章漣漪

編輯 | 邱鍇俊

在短暫叫停之后,特斯拉Dojo項目又“殺”回來了。這次,它換上了全新的思路。

1月19日,特斯拉創(chuàng)始人馬斯克在X平臺發(fā)文宣布,隨著AI5芯片設(shè)計完成,公司將重啟超級計算機項目Dojo 3的開發(fā)工作。同時,他發(fā)出“英雄帖”,招聘人才參與研發(fā)“世界上產(chǎn)量最高的芯片”,并要求用三個要點介紹自己解決過的最棘手技術(shù)難題。

五個月前,特斯拉曾全面叫停Dojo項目。彼時,馬斯克回復(fù)網(wǎng)友稱,特斯拉分散資源并同時開發(fā)兩種截然不同的AI芯片設(shè)計是沒有意義的。特斯拉的 AI5、AI6及后續(xù)芯片在推理方面將表現(xiàn)出色,至少在訓(xùn)練方面相當(dāng)不錯,所有努力都將集中在這些芯片上面。

如此,伴隨著Dojo 3超級計算機項目的重啟,特斯拉自研AI算力戰(zhàn)略再次回歸,并進行了一次策略修正。

01

一場激進的技術(shù)豪賭

Dojo是特斯拉自主研發(fā)、專為AI訓(xùn)練設(shè)計的超級計算集群。其核心目標(biāo)是處理特斯拉全球車隊收集的海量視頻數(shù)據(jù),以極快速度訓(xùn)練和迭代其全自動駕駛(FSD)系統(tǒng)。

2021年特斯拉AI Day上,首款用于打造Dojo的芯片D1亮相,采用分布式結(jié)構(gòu)和7納米工藝,搭載500億個晶體管、354個訓(xùn)練節(jié)點,僅內(nèi)部的電路就長達17.7公里,實現(xiàn)了超強算力和超高帶寬。

從馬斯克透露的消息來看,D1的設(shè)計哲學(xué)是極致優(yōu)化,即通過剝離一代通用計算功能,打造出一個精簡的、大規(guī)模并行的訓(xùn)練“猛獸”,其激進架構(gòu)主要體現(xiàn)在兩方面。

一是無緩存的雙層存儲系統(tǒng)。Dojo 的D1計算芯片完全摒棄了傳統(tǒng)的緩存層次結(jié)構(gòu)和虛擬內(nèi)存,354個內(nèi)核都能直接訪問1.25MB 的本地SRAM。這通過去除復(fù)雜的內(nèi)存管理硬件,最大化了計算密度和功耗效率。

二是“無膠化(Glueless)”的晶圓級互連。Dojo的真正核心是其互連設(shè)計,由于其“邊緣”都是一個速度高達40TB/s的互聯(lián)連接器。這意味著D1芯片可以直接以“邊對邊”的形式連接,并由此組成了一個Dojo超級計算機的單個訓(xùn)練模塊。

后者由25個D1芯片組成,因每個D1芯片之間都是無縫連接在一起,相鄰芯片之間的延遲極低,訓(xùn)練模塊最大程度上實現(xiàn)了帶寬的保留,配合特斯拉自創(chuàng)的高帶寬、低延遲的連接器;在不到1立方英尺的體積下,算力高達9PFLOPs(9千萬億次),I/O帶寬高達36TB/s。

基于此,馬斯克提出:將使用D1芯片打造的超級計算機集群Dojo ExaPOD。其由120個節(jié)點、總共3000塊D1芯片組成,計算單元數(shù)超過100萬(3000*354),在BF16/CFP8精度下的算力達到1.1ExaLOPS,遠(yuǎn)超目前全球最快的超級計算機富岳,后者算力為44.201 TFlops。

彼時,馬斯克還在推特上回復(fù)網(wǎng)友時表示,ExaPOD的運算能力足以模擬人腦。而這僅僅是一個開始,他稱下一代Dojo還將得到10倍的性能提升。

02

三重困境導(dǎo)致項目擱淺

然而,這一超前設(shè)計在2025年遭遇重挫。

2025年8月8日,有外媒報道稱,特斯拉正在解散其Dojo團隊,其負(fù)責(zé)人Peter Bannon也將離開公司,該團隊剩余的員工將被重新分配到特斯拉內(nèi)部的其他數(shù)據(jù)中心和計算項目,公司計劃增加對外部技術(shù)合作伙伴的依賴。

對此,馬斯克本人給出的解釋是,分散資源設(shè)計兩款不同的芯片沒有意義。

但這顯然并不是全部,其背后是技術(shù)、人才、成本三重困境的疊加。

技術(shù)上,架構(gòu)復(fù)雜難以駕馭,產(chǎn)業(yè)鏈存在制造瓶頸。

Dojo項目的核心矛盾源于其顛覆性的設(shè)計理念。該架構(gòu)摒棄了傳統(tǒng)CPU/GPU的通用性設(shè)計思路,專注于將 AI 訓(xùn)練負(fù)載的計算密度與能效推向極致。然而,這種對特定目標(biāo)的極致追求,導(dǎo)致其在內(nèi)存和互連系統(tǒng)上引入了極高的技術(shù)復(fù)雜度。

架構(gòu)復(fù)雜性的直接后果是極低的制造良率。在晶圓尺寸的模組上,任何微小的布線缺陷或25顆D1芯片中任一的貼裝瑕疵,都可能導(dǎo)致高價值的Training Tile整體報廢。低良率使得規(guī);渴鸬某杀靖甙,較難具備商業(yè)上的經(jīng)濟可行性。

這種設(shè)計在理論上性能卓越,但在工程實踐和量產(chǎn)中面臨的挑戰(zhàn)巨大,成為項目失敗的根本原因。

人才上,則是核心團隊集體流失。

DensityAI 創(chuàng)始團隊。資料來源:華泰證券

據(jù)彭博社報道,2023年Dojo負(fù)責(zé)人Ganesh Venkataramanan離開后,成立了競對初創(chuàng)公司DensityAI,隨后陸陸續(xù)續(xù)約20名核心工程師離開特斯拉并加入DensityAI。

成本上,充分考慮效益平衡,并開始依靠外部合作伙伴。

馬斯克長期將Dojo定位為高風(fēng)險、高回報的“前瞻性項目”,其可行性核心在于:定制化架構(gòu)在性能上的優(yōu)勢能否足以抵消所需的巨額投入與研發(fā)難度。然而,隨著英偉達Blackwell、Rubin系列及AMD MI350、MI400系列等高性能芯片相繼推出,Dojo的潛在性能領(lǐng)先空間明顯收窄。

在內(nèi)部成本持續(xù)攀升、項目進度多次延期且需從其他戰(zhàn)略重點轉(zhuǎn)移資源的背景下,特斯拉在充分考慮成本效益平衡下,轉(zhuǎn)而傾向于外部成熟方案。

Dojo分布式架構(gòu)示意圖

因此,特斯拉在2025年7月轉(zhuǎn)向務(wù)實路線:與三星簽訂165億美元的AI6芯片代工合同,并在訓(xùn)練算力上加強依賴英偉達與AMD等。

03

Dojo 3.0“務(wù)實”回歸

作為“第一性原理”的堅定信徒,馬斯克并未放棄自研算力的夢想。此次回歸,他帶來的是一個截然不同、更為務(wù)實的Dojo 3.0方案。

重啟的關(guān)鍵前提,是特斯拉新一代車端AI芯片(AI5/AI6) 取得進展。

根據(jù)馬斯克透露,特斯拉AI5芯片已接近設(shè)計完成,而AI6芯片目前處于早期階段,后續(xù)還將推出AI7、AI8、AI9,目標(biāo)是在9個月內(nèi)完成設(shè)計周期。

其中,AI5用于智能汽車和機器人。AI6則是機器人和數(shù)據(jù)中心都能用。AI7將瞄向太空算力。

這一速度明顯快于行業(yè)平均水平。目前,主流芯片廠商通常采用一年左右的更新周期。

不過,外界對馬斯克這一言論存有質(zhì)疑。據(jù)此前公開表態(tài),馬斯克曾在2023年7月稱AI5芯片已經(jīng)“設(shè)計完成”。若此說法屬實,則當(dāng)前再度提及“接近完成設(shè)計”便顯得前后不一。

但無論如何,AI5對特斯拉確實非常重要。

AI5是特斯拉用于車端的下一代輔助駕駛芯片,即HW(Hardware)系列的延續(xù)。

馬斯克透露,AI5芯片將主要用于自動駕駛系統(tǒng)的訓(xùn)練與推理計算,并為特斯拉人形機器人Optimus提供算力基礎(chǔ)。目前,特斯拉在售車型主要依賴AI4(HW4)芯片來運行FSD系統(tǒng)。

根據(jù)馬斯克描述,AI5芯片單顆SoC性能大致相當(dāng)于英偉達Hopper級別,雙芯配置則接近Blackwell級別,但其成本極低,功耗也更低。

特斯拉劇透AI5芯片性能

“解決AI5芯片問題對特斯拉來說至關(guān)重要。”馬斯克解釋道:“如今AI5進展順利,我們終于有了一些余力,可以重新啟動Dojo 3的研發(fā)工作了。”

盡管Dojo重啟,但與此前相比,還是進行了一定的調(diào)整。

與此前不同,Dojo 3項目的核心在于架構(gòu)重構(gòu)與成本優(yōu)化,徹底摒棄了前兩代Dojo依賴自研D1芯片及晶圓級封裝的復(fù)雜路徑。

根據(jù)特斯拉戰(zhàn)略規(guī)劃,Dojo 3本質(zhì)上是將512顆AI5或AI6芯片密集集成于單塊主板,形成超級計算機集群,這種設(shè)計能將網(wǎng)絡(luò)布線復(fù)雜性與硬件成本降低數(shù)個數(shù)量級,同時保留大規(guī)模并行計算能力。其中AI6芯片將采用2納米制程工藝,計劃整合原Dojo架構(gòu)優(yōu)勢,實現(xiàn)車輛、Optimus機器人與數(shù)據(jù)中心的AI生態(tài)適配。

這一轉(zhuǎn)變的好處是顛覆性的。

成本與復(fù)雜度驟降:直接采用成熟、可大規(guī)模生產(chǎn)的芯片,繞過了D1恐怖的制造良率陷阱。馬斯克稱,這能將網(wǎng)絡(luò)布線復(fù)雜性和成本“降低幾個數(shù)量級”。

生態(tài)協(xié)同:實現(xiàn)了車端、機器人、云端數(shù)據(jù)中心的算力底層統(tǒng)一。芯片研發(fā)成果可多處復(fù)用,極大提升了研發(fā)效率和生態(tài)凝聚力。

風(fēng)險可控:芯片制造依賴三星等成熟代工廠,特斯拉專注于自己更擅長的系統(tǒng)架構(gòu)與集成創(chuàng)新。

特斯拉Dojo項目的重啟,不是一次簡單的“復(fù)活”,而是一場戰(zhàn)略進化。它標(biāo)志著特斯拉的AI算力戰(zhàn)略從追求極致的單一架構(gòu)探索,演進為更務(wù)實、更系統(tǒng)化的生態(tài)構(gòu)建:即以車端AI芯片為核心基點,通過架構(gòu)創(chuàng)新將其擴展為高效的云端訓(xùn)練集群,從而實現(xiàn)車輛、機器人、數(shù)據(jù)中心三位一體的算力協(xié)同。

如果成功,Dojo 3或?qū)⒉粌H為特斯拉的自動駕駛與機器人夢想提供澎湃動力,更可能重塑AI時代算力基礎(chǔ)設(shè)施的構(gòu)建范式。

-END-

       原文標(biāo)題 : 叫停5個月后,特斯拉Dojo超算“換芯”歸來

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號