訂閱
糾錯
加入自媒體

算力競速(上):GPU如何蛻變?yōu)锳I時代的新石油

文|錢眼君

來源|博望財經(jīng)

歲末年初,中國資本市場的聚光燈前所未有地聚焦于黃浦江畔。一場聲勢浩大的“GPU旋風(fēng)”正席卷而來:在不到一個月的時間里,沐曦股份、壁仞科技、天數(shù)智芯三家扎根上海的GPU企業(yè)密集登陸資本市場,而與其并稱“上海GPU四小龍”的燧原科技,也已完成IPO輔導(dǎo),即將為這場盛宴落下最后一塊拼圖。

從科創(chuàng)板首日暴漲692.95%的造富神話,到港交所超2300倍的驚人認購紀(jì)錄;從百億級的IPO募資規(guī)模到千億市值俱樂部的批量誕生,國產(chǎn)GPU企業(yè)正以其凌厲的資本攻勢,宣告著國產(chǎn)算力產(chǎn)業(yè)一個新時代的來臨。

這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業(yè)化落地,上市首日市值即突破3000億元,創(chuàng)下多項紀(jì)錄;壁仞科技作為"港股國產(chǎn)GPU第一股",獲得23家基石投資者力挺;天數(shù)智芯則以首家實現(xiàn)國產(chǎn)7nm訓(xùn)練推理通用GPU量產(chǎn)的身份,攜覆蓋20多個行業(yè)的業(yè)績登陸港交所。

然而,光環(huán)之下亦有隱憂:天數(shù)智芯三年半累計虧損超28億元,壁仞科技同期虧損超63億元,揭示出這個高投入、高風(fēng)險行業(yè)在搶占窗口期時的"流血沖鋒"本質(zhì)。

這是一場關(guān)乎智能未來的產(chǎn)業(yè)競速賽:一邊是國際巨頭以"黃氏定律"般的速度壘高技術(shù)壁壘,一邊是中國本土力量在資本與政策的雙重加持下集體破局。而要理解這場競賽的深層邏輯,我們必須回溯GPU從游戲配件到算力核心的蛻變之路。

01

定義核心:從圖形助手到算力引擎的蛻變

在探討這場席卷全球的算力革命之前,我們先來厘清一個核心概念——GPU。GPU全稱Graphics Processing Unit,圖形處理器。我們常聽說的CPU(Central Processing Unit)是指中央處理器,它與GPU的核心差異在于架構(gòu)設(shè)計:CPU通常擁有少數(shù)幾個強大的核心,擅長處理復(fù)雜的通用串行任務(wù),如同一位能解奧數(shù)題的中學(xué)生;而GPU則集成數(shù)千個相對簡單的核心,專為處理海量同質(zhì)化的并行任務(wù)而生,好比幾百個小學(xué)生協(xié)作完成數(shù)萬道加減法。

圖片

圖:GPU在計算機中的位置,公開資料整理。

如果說CPU是計算機的"大腦",負責(zé)決策與控制,那么GPU則是專精于"大規(guī)模重復(fù)勞動"的"肌肉",其并行計算的天性,使其在圖形渲染和高效能矩陣運算(人工智能的核心)中的效率遠超CPU。

隨著5G與人工智能時代的到來,數(shù)據(jù)中心內(nèi)機器學(xué)習(xí)等AI計算已占據(jù)總計算量的四分之一到三分之一,大數(shù)據(jù)處理的重任正從CPU向算力更強的GPU轉(zhuǎn)移。GPU的應(yīng)用早已超越傳統(tǒng)的個人電腦圖形顯示,其形態(tài)按接入方式可分為獨立與集成;其疆域已擴展至移動設(shè)備、數(shù)據(jù)中心服務(wù)器與個人電腦等多個場景。尤其在AI與云計算浪潮下,GPU憑借其與生俱來的并行計算優(yōu)勢,成為了數(shù)據(jù)處理的核心引擎,開辟出一個規(guī)模空前的增長市場。盡管FPGA和ASIC等更為專用的計算芯片也在特定領(lǐng)域嶄露頭角,但行業(yè)共識在于,GPU憑借其卓越的通用性、成熟的軟件生態(tài)(尤其是英偉達的CUDA)及強大的綜合算力表現(xiàn),仍是當(dāng)前AI計算領(lǐng)域無可爭議的霸主與主導(dǎo)架構(gòu)。

這一定位,是理解其萬億級產(chǎn)業(yè)價值的邏輯起點。

02

GPU從哪來:一部從游戲顯卡到AI基石的創(chuàng)業(yè)史

GPU產(chǎn)業(yè)的崛起,是一部典型的硅谷技術(shù)創(chuàng)業(yè)史詩,而其主角無疑是英偉達(NVIDIA)。故事的開端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍圖。1993年,英偉達正式成立,開始的創(chuàng)業(yè)之路充滿坎坷,至1995年,公司面臨設(shè)計出芯片卻無資金建廠制造的困境。創(chuàng)始人黃仁勛致信臺積電創(chuàng)始人張忠謀求助,并成功獲得支持。

這段合作被黃仁勛本人視為關(guān)鍵轉(zhuǎn)折:"如果當(dāng)初我自己建廠生產(chǎn)GPU芯片,我現(xiàn)在可能就是一個守著幾千萬美元的公司的安逸的CEO。"臺積電的代工模式讓英偉達得以輕資產(chǎn)運營,聚焦設(shè)計與創(chuàng)新,從而快速迭代產(chǎn)品,搶占市場。

1999年,英偉達做出了兩個定義行業(yè)的舉動:一是徹底轉(zhuǎn)型專注于顯卡芯片,二是首次在全球提出"GPU"這一革命性概念(但在提出這個概念以后的相當(dāng)一段時間內(nèi),GPU還僅僅用于圖形處理,遠不像現(xiàn)在這般如雷貫耳)。同年,公司在納斯達克上市,市值達6.26億美元,開啟了長達二十余年的高速增長傳奇。

然而,硬件性能的領(lǐng)先并非其構(gòu)筑護城河的終極武器。真正的"神來之筆"發(fā)生在2006年,英偉達在推出新一代GPU的同時,發(fā)布了具有劃時代意義的CUDA計算平臺。CUDA即Compute Unified Device Architecture,統(tǒng)一計算架構(gòu),本質(zhì)上是一套軟件工具,它讓開發(fā)者能夠以前所未有的便捷性,調(diào)用GPU的強大算力進行通用計算(GPGPU),這為后來深度學(xué)習(xí)的爆發(fā)埋下了伏筆。

起初,CUDA的商業(yè)價值并未被市場立刻接受。但英偉達展現(xiàn)出了驚人的戰(zhàn)略耐心與遠見:向全球高校和研究所免費開放并設(shè)立研發(fā)中心;以資金扶持創(chuàng)業(yè)公司使用;持續(xù)開源核心軟件庫;甚至確保廉價的消費級游戲顯卡也支持CUDA,將開發(fā)門檻降至千元級別。

經(jīng)過十余年不計短期回報的持續(xù)灌溉,CUDA逐漸從一款開發(fā)工具,演進為高端計算與圖形領(lǐng)域的事實標(biāo)準(zhǔn),構(gòu)筑了堪比操作系統(tǒng)般的深厚生態(tài)壁壘。即便競爭對手的GPU硬件性能參數(shù)相近,但在AI開發(fā)社區(qū)的受歡迎程度卻有天壤之別,核心差距就在于CUDA所帶來的開發(fā)效率與計算效能倍增。

圖片

圖:關(guān)于CUDA的描述,來自英偉達官網(wǎng)

直到2014年前后,英偉達將CUDA與AI計算完美融合,英偉達的騰飛才真正開始。如今,CUDA連接了全球數(shù)百萬開發(fā)者,使英偉達GPU成為AI時代事實上的"計算貨幣",其護城河之深,已難以用單純的晶體管數(shù)量或浮點算力來衡量。這也能說明為何國產(chǎn)GPU公司很難實現(xiàn)快速超車。

03

技術(shù)爭鋒:HBM、架構(gòu)迭代與性能軍備競賽

驅(qū)動GPU產(chǎn)業(yè)以"黃氏定律"速度(顯示芯片性能每6個月提升1倍,AI算力在8年內(nèi)實現(xiàn)千倍增長)前進的,是持續(xù)不斷的技術(shù)創(chuàng)新與白熱化的性能軍備競賽。筆者梳理發(fā)現(xiàn),當(dāng)前的技術(shù)角逐主要集中在3個關(guān)鍵維度:

1、存儲技術(shù)的躍遷

算力的爆炸式增長,不僅需要強大的"引擎"(GPU核心),更依賴于能夠?qū)崟r"喂飽"引擎數(shù)據(jù)的"高速糧道"。自2017年起,英偉達便在高端AIGPU(如A100、H100)中率先采用HBM(高頻寬存儲器)技術(shù)。

這與傳統(tǒng)的GDDR(Graphics Double Data Rate)內(nèi)存有本質(zhì)不同:GDDR作為傳統(tǒng)的內(nèi)存技術(shù),提供了平衡的性能和成本,適用于廣泛的圖形應(yīng)用,而HBM則更專注于提供高性能、高帶寬以及更能效的解決方案,適用于對數(shù)據(jù)傳輸速度和能效要求更高的領(lǐng)域。在結(jié)構(gòu)上,GDDR是一種傳統(tǒng)的圖形內(nèi)存,通常以單個芯片的形式存在,它的設(shè)計比較扁平,內(nèi)存芯片以并行方式連接到圖形處理單元(GPU)。HBM通過3D堆疊、硅通孔(TSV)等尖端封裝工藝,將多層DRAM芯片像蓋樓一樣垂直堆疊,并與GPU邏輯芯片通過硅中介層緊密集成。這種設(shè)計帶來了革命性優(yōu)勢:HBM擁有數(shù)倍于GDDR的帶寬和更低的功耗,但代價是結(jié)構(gòu)極度復(fù)雜、成本高昂。

圖片

圖:H200,英偉達官網(wǎng)

以英偉達2023年底發(fā)布的H200 GPU為例,它首次搭載HBM3e,顯存帶寬高達4.8TB/秒,用于700億參數(shù)大模型推理時,速度是前代H100的1.9倍,能耗卻降低一半。這清晰表明,突破"內(nèi)存墻"是算力持續(xù)進化的生死線。

2、架構(gòu)平臺的高速代際飛躍

GPU行業(yè)中,很多企業(yè)把英偉達當(dāng)成終極目標(biāo),但筆者看來,一個殘酷的事實是,這個終極目標(biāo)并非原地不動等待超越,而是仍在向前狂奔,保持著約兩年一次架構(gòu)升級的殘酷節(jié)奏。其下一代平臺"Rubin"已提上日程,計劃于2026年量產(chǎn)。Rubin不再僅僅是單一的GPU芯片,而是一個整合了Rubin GPU、專為AI推理設(shè)計的Vera CPU、新一代NV Link交換機芯片、高速網(wǎng)卡的龐大計算系統(tǒng)。其中,Rubin GPU的關(guān)鍵指標(biāo)呈現(xiàn)跨代躍升:FP4推理性能預(yù)計達到當(dāng)前Blackwell架構(gòu)的5倍。這場競爭已從單一的"芯片對決"升級為"系統(tǒng)平臺戰(zhàn)爭",比拼的是從芯片到集群的全棧優(yōu)化能力。

3、圖形與計算的雙重挑戰(zhàn)

盡管AI計算是當(dāng)前最大的風(fēng)口,但圖形顯示功能本身的技術(shù)壁壘實際上更為森嚴(yán)。硬件結(jié)構(gòu)上,一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專門優(yōu)化的硬件單元,其復(fù)雜程度遠超專注于矩陣計算的AI芯片;算法上,圖形處理涉及計算機圖形學(xué),需要融合物理模擬、光學(xué)渲染等多學(xué)科知識,算法難度極高。

因此,能夠同時駕馭高性能圖形渲染與通用AI計算的"全功能GPU",代表了芯片設(shè)計領(lǐng)域的皇冠明珠,這也是諸多國產(chǎn)GPU廠商將"全功能"作為核心戰(zhàn)略方向的原因。

當(dāng)國際巨頭在技術(shù)前沿高歌猛進,用一代代產(chǎn)品定義著算力標(biāo)準(zhǔn)時,一個關(guān)鍵問題擺在全球產(chǎn)業(yè)面前:在這條被巨頭劃定的賽道上,后來者還有機會嗎?中國的答案,正在上海張江的實驗室里、在資本市場的鑼聲中、在一張張累計虧損數(shù)十億的財務(wù)報表背后,悄然書寫。從技術(shù)追隨到生態(tài)破局,國產(chǎn)GPU的征途,遠比想象中更加艱難,也更加波瀾壯闊,我們下篇繼續(xù)分析。

       原文標(biāo)題 : 算力競速(上):GPU如何蛻變?yōu)锳I時代的新石油

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號