訂閱
糾錯(cuò)
加入自媒體

5年狂賺5825倍!中國(guó)最像英偉達(dá)的公司終于上市了

今天,A股上演了一場(chǎng)真正的“印鈔狂歡”。

被大家念叨了很久的“國(guó)產(chǎn)GPU第一股”——摩爾線程,終于登陸科創(chuàng)板了。

你看這股價(jià),首日一度高開468.78%,開盤價(jià)每股650元,市值一度突破3000億元。

圖片

在這波狂歡里,創(chuàng)始人張建中贏麻了,僅直接持股市值就達(dá)287.56億。早期投資人也賺得盆滿缽滿。最早的投資人沛縣乾曜累計(jì)浮盈高達(dá)5825倍。

在2020年12月,和而泰投了摩爾線程3000萬,現(xiàn)在變成了26.68億,5年時(shí)間直接漲了近88倍。

資本為什么這么瘋狂?就沖著它腦門上那個(gè)全市場(chǎng)最性感的標(biāo)簽—— “中國(guó)版英偉達(dá)”。

這可不是瞎貼金。摩爾線程的班底那可是正兒八經(jīng)的“英偉達(dá)嫡系”,張建中更是長(zhǎng)期擔(dān)任英偉達(dá)全球副總裁、中國(guó)區(qū)總經(jīng)理。

借助這個(gè)熱乎勁,今天我們就來盤一盤,這家被捧上神壇的公司,成色到底怎么樣?

/ 01 /

5年4代GPU,最新性能接近英偉達(dá)H20

顯卡這玩意兒,如果不談場(chǎng)景只談參數(shù),那就是在耍流氓。

咱們把話說明白點(diǎn)。

搞AI計(jì)算,核心指標(biāo)其實(shí)就看三個(gè):算力、顯存、帶寬。

顯存決定了你能處理的模型大小,算力代表著能同時(shí)處理多少數(shù)據(jù),帶寬則代表固定期限能傳輸多少數(shù)據(jù)。

如果顯存不夠,大模型直接跟你說拜拜,就像小顯卡跑3A大作直接爆顯存一樣,不講道理。

如果算力和帶寬不夠,那就是老牛拉破車,別人跑完了,你還在那loading。

好,鋪墊完了,咱們來看看摩爾線程。

自2020年成立以來,摩爾線程已推出“蘇堤”、“春曉”、“曲院”、“平湖”四代GPU架構(gòu),從第三代曲院開始重心轉(zhuǎn)向AI計(jì)算,最新一代“平湖”GPU于2024年發(fā)布,基于該GPU的S5000的最新產(chǎn)品。

看數(shù)據(jù),S5000在FP32精度下的算力是32 TFLOPS。同時(shí),平湖架構(gòu)GPU最大顯存容量推斷為80GB,推斷S5000顯存容量應(yīng)為80GB,帶寬未知。

這是什么概念?咱們拉出英偉達(dá)的GPU看看:A100的FP32算力是19.5,H20是44,H100是67。

單看FP32這一項(xiàng),S5000一拳打翻了A100,甚至快摸到了H20的尾巴。雖然離H100那種“怪物”還有差距,但看著是不是挺熱血沸騰?

且慢,先別急著開香檳。

上面的參數(shù)并不能代表S5000的實(shí)際AI算力水平,原因就出在這個(gè)“FP32”上。

AI計(jì)算中,需要用到不同精度的數(shù)據(jù),F(xiàn)P32是其中一種,此外還有FP64、FP16/BF16、FP8、FP4、INT8等多種常見數(shù)據(jù)類型。

字母后面的數(shù)字代表在存儲(chǔ)里占用的字節(jié),數(shù)字增大,數(shù)據(jù)精度評(píng)估。FP32能表示小數(shù)點(diǎn)后7位左右,F(xiàn)P16能達(dá)到小數(shù)點(diǎn)后3位左右,INT8能表示-128到127之間的整數(shù)。

相應(yīng)的,數(shù)據(jù)位數(shù)越大,占用內(nèi)存越大,計(jì)算速度也更慢。因此,不同AI任務(wù)需要找到最合適的數(shù)據(jù)類型,像醫(yī)學(xué)、軍事、科學(xué)等領(lǐng)域?qū)φ`差比較敏感的,就需要用到FP64數(shù)據(jù)。

現(xiàn)在的AI大模型,不是在那搞火箭軌道計(jì)算,所以不需要那么高的精度。

現(xiàn)在大家為了快,為了省內(nèi)存,都在搞混合精度。FP16、BF16,甚至FP8(8位浮點(diǎn))才是現(xiàn)在AI訓(xùn)練和推理的“主戰(zhàn)場(chǎng)”。

就像你切菜,不需要拿著做眼科手術(shù)的手術(shù)刀去切,拿著菜刀(FP8/FP16)反而砍得更快。

所以,S5000那個(gè)漂亮的FP32數(shù)據(jù),在AI領(lǐng)域里,參考價(jià)值得打個(gè)折。關(guān)鍵得看它在FP16或者FP8下的表現(xiàn)。

關(guān)于這點(diǎn),有媒體曾經(jīng)披露過,據(jù)參與S5000產(chǎn)品測(cè)試的人士透露,S5000是國(guó)內(nèi)真正對(duì)標(biāo)H100的產(chǎn)品,其FP8計(jì)算能力對(duì)DeepSeek-V3/R1這樣的MoE大模型訓(xùn)練“是個(gè)絕配”。

但由于相關(guān)信息較少,摩爾線程S5000的實(shí)際表現(xiàn)仍未可知。

再看看隔壁的友商們,那也是卷得飛起。

華為昇騰910C NPU目前公布的BF16/FP16總算力達(dá)752 TFLOPS,超過了英偉達(dá)H20和A100,但不到H100的一半,片上內(nèi)存(可簡(jiǎn)單類比顯存)和帶寬與H100基本在同一水平。

寒武紀(jì)目前在售思元590芯片,F(xiàn)P16算力為256TFLOPS,接近A100水平。沐曦集成未公布數(shù)據(jù),僅表示曦云C500和C550兩款GPU在FP16/BF16指標(biāo)上,處于英偉達(dá)A100的算力區(qū)間。

不過,也有行業(yè)內(nèi)部人士稱,在實(shí)際訓(xùn)練推理環(huán)境中,摩爾線程等國(guó)產(chǎn)AI計(jì)算卡的紙面參數(shù)算力往往需要打個(gè)折扣。

必須承認(rèn),單看指標(biāo),摩爾線程離英偉達(dá)確實(shí)還有很長(zhǎng)的路要跑。

但這不重要,重要的是它還在跑。在他們身上,我們把國(guó)產(chǎn)GPU死磕到底的那股勁兒。只要還在往前拱,這件事就有戲。給點(diǎn)耐心,挑戰(zhàn)者永遠(yuǎn)值得瑞思拜。

/ 02 /

一個(gè)S5000集群,貢獻(xiàn)一半以上營(yíng)收

雖然大家都說摩爾線程是“國(guó)產(chǎn)英偉達(dá)”,但只要你翻開本本,就會(huì)發(fā)現(xiàn)兩者的賺錢方式其實(shí)大有區(qū)別。

比較典型的體現(xiàn)是,英偉達(dá)不直接銷售AI智算集群,而摩爾線程主要營(yíng)收卻來自于集群產(chǎn)品。

今年上半年,摩爾線程共賣出了5個(gè)智算集群,其中4個(gè)集成512個(gè)S4000 GPU,另一個(gè)是集成2048個(gè)S5000 GPU的集群,這也是摩爾線程賣出的第一個(gè)S5000集群。資料顯示,僅這一個(gè)S5000集群,就為摩爾線程貢獻(xiàn)了3.97億元營(yíng)收,占上半年總營(yíng)收一半以上。

據(jù)招股資料顯示,這一個(gè)S5000集群的客戶為“重大科技創(chuàng)新平臺(tái)”,大概率是某個(gè)國(guó)家實(shí)驗(yàn)室。值得一提的是,目前國(guó)產(chǎn)AI計(jì)算卡企業(yè)中,華為是絕對(duì)龍頭,客戶較為廣泛。寒武紀(jì)主要客戶為字節(jié)跳動(dòng),據(jù)行業(yè)內(nèi)人士透露,沐曦集成則主要面向信創(chuàng)GPU市場(chǎng)。

而英偉達(dá)之所以不賣AI智算集群的原因,是因?yàn)檫@事的毛利率比賣芯片可差多了。

現(xiàn)在,英偉達(dá)賣 GPU 的毛利率高達(dá)70%,而賣AI集群的毛利率可就要低很多,因?yàn)锳I 智算集群的建設(shè)和維護(hù)也需要大把的錢。

雖然毛利率低,可對(duì)于尚處于追趕階段的摩爾線程也不算一個(gè)壞的選擇。

因?yàn)橄啾扔谫uGPU,賣集群更容易做大營(yíng)收規(guī)模。集群本質(zhì)上就是把一堆GPU連接在一起,共同執(zhí)行AI任務(wù),賣一個(gè)集群就相當(dāng)于一次性賣出幾百上千甚至更多GPU。

更關(guān)鍵的是,賣集群這事也不是誰想干就能干的。

現(xiàn)階段AI模型越做越大,單卡或者多卡組合已經(jīng)滿足不了訓(xùn)練需求,同時(shí)消費(fèi)端推理需求暴增,AI大廠和云服務(wù)廠商只能建設(shè)更大的算力集群來滿足行業(yè)需求。

比如,馬斯克的xAI孟菲斯超級(jí)集群一期就集成了10萬張H100GPU,亞馬遜的Project Rainier更是集成了近50萬顆自研芯片。

AI計(jì)算是一場(chǎng)對(duì)速度的極致考驗(yàn),每塊GPU類似一段高速公路,這些高速路段并沒有相連,每行駛一段就得出高速然后重新上另一段高速。

于是,當(dāng)GPU越來越多,就帶了另一個(gè)問題:怎么把這些GPU更好地連接起來?

這就引出了建設(shè)AI算力集群一個(gè)關(guān)鍵技術(shù)——GPU互聯(lián)技術(shù)。

英偉達(dá)之所以這么牛,是因?yàn)樗茉缇烷_發(fā)出來NVLink技術(shù),相當(dāng)于把每段高速的連接路段也修成了高速,相鄰的幾張GPU兩兩互通,提升計(jì)算速度。目前應(yīng)用的NVLink5.0技術(shù)卡間互聯(lián)帶寬高達(dá)1.8TB/s,即將推出的6.0技術(shù)帶寬將升級(jí)至3.6TB/s。

在卡間互聯(lián)上,摩爾線程也推出了自研的MT-Link技術(shù),目前最新的MT-Link3.0互聯(lián)帶寬達(dá)1.3TB/s,介于NVLink4.0(帶寬900GB/s)和5.0之間。招股資料中,摩爾線程表示MT-Link3.0已經(jīng)達(dá)到行業(yè)領(lǐng)先水平。

不過,公司也說了,目前摩爾線程最新的平湖GPU架構(gòu)和S5000 GPU上,用的還是MT-Link2.0技術(shù),片間互聯(lián)帶寬為800GB/s。也就是說,新研發(fā)的3.0技術(shù)還沒應(yīng)用到產(chǎn)品上。

雖然摩爾線程在GPU互聯(lián)技術(shù)做得不錯(cuò),但其AI集群也面臨著另一個(gè)現(xiàn)實(shí)挑戰(zhàn),那就是規(guī)模。

一般來說,兩兩互聯(lián)的卡數(shù)量有著較難突破的物理極限。由于每家廠商采用的互聯(lián)結(jié)構(gòu)不同,這個(gè)極限并不相同,比如英偉達(dá)最新的Blackwell架構(gòu)支持72個(gè)GPU互聯(lián),谷歌TPU在卡間互聯(lián)上最多形成4X4X4(即64個(gè)TPU)的小立方體,這樣的互聯(lián)極限一般被稱為節(jié)點(diǎn)。

摩爾線程現(xiàn)有的KUAE2集群技術(shù),每個(gè)節(jié)點(diǎn)集成8顆模塊化GPU,節(jié)點(diǎn)之間采用的InfiniBand/RoCE的網(wǎng)絡(luò)方案進(jìn)行互聯(lián),這兩種都是行業(yè)主流網(wǎng)絡(luò)互聯(lián)方案。KUAE2集群最多可包含1280個(gè)節(jié)點(diǎn),最大可支持10240個(gè)GPU。

不過,摩爾線程賣出的最大集群僅包含2048張卡。據(jù)行業(yè)人士透露,在AI計(jì)算卡集群上,5000卡是一個(gè)關(guān)鍵瓶頸,因?yàn)榧阂?guī)模上去后,對(duì)電源、電力、散熱以及系統(tǒng)調(diào)控等諸多方面都是一個(gè)極大的考驗(yàn)。因此相比于動(dòng)輒10萬卡、20萬卡互聯(lián)的英偉達(dá),摩爾線程的KUAE集群技術(shù)仍需要進(jìn)一步完善及迭代。

雖然技術(shù)上還在追趕,離萬卡集群也還有距離。但在國(guó)產(chǎn)替代的大潮下,能把千卡級(jí)別的集群賣出去,而且真金白銀地賺到錢,已經(jīng)是一件很了不起的事情了。

只要有人買單,這把火,就還能繼續(xù)燒下去。

/ 03 /

5年5825倍的造富神話

除了國(guó)產(chǎn)GPU追趕英偉達(dá)的故事,摩爾線程上市另一個(gè)話題便是,造富。

最直接的體現(xiàn)就是創(chuàng)始團(tuán)隊(duì)。公告顯示,發(fā)行后張建中直接持股9.4127%,按上市首日的價(jià)格,即使不算間接持股,張建中持股市值就高達(dá)287.56億元。

最早下場(chǎng)的機(jī)構(gòu)股東同樣賺得盆滿缽滿。

摩爾線程成立三個(gè)月,深圳明皓、沛縣乾曜就迅速入局。據(jù)摩爾線程公布的法律意見書,沛縣乾曜是以1元的價(jià)格入股,投前估值僅1000萬元,沛縣乾曜以190.4762萬元入股,拿到了13.4%股份。同期入股的深圳明皓以35.28元的價(jià)格入股,投了8000萬元,拿到了16%股份。

之后,沛縣乾曜以253.60元的價(jià)格轉(zhuǎn)讓了近20萬元的注冊(cè)資本,套現(xiàn)約5000萬元。此次發(fā)行后沛縣乾曜仍持有1699.87萬股,占總股本的3.6165%,開盤市值為110.48億元,以此計(jì)算沛縣乾曜累計(jì)浮盈超5825倍。

深圳明皓先后在2021年10月和今年初分別套現(xiàn)了2000萬元和1.57億元,發(fā)行后持有1992.27萬股,持股比例為4.2386%,開盤市值為129.49億元,累計(jì)浮盈達(dá)163倍。

在之后的天使輪中,摩爾線程引入了紅杉資本、聞名泉豐、和而泰、深圳一創(chuàng)、五源啟興五家機(jī)構(gòu)。資料顯示,此輪融資投后估值為16.46億元,和而泰投了3000萬元。此次發(fā)行后和而泰持股比例為0.8734%,以開盤價(jià)計(jì)算持股市值26.68億元,增值了近88倍。

紅杉資本曾多次追投,天使輪、Pre-A輪和B輪合計(jì)投入約2.12億元,發(fā)行后持股1915.44萬股,持股比例為4.0752%,持股市值124.50億元,增值了近58倍。

不過也有在IPO前提前離場(chǎng)的機(jī)構(gòu)。字節(jié)跳動(dòng)旗下量子躍動(dòng)在Pre-A輪向摩爾線程投了約5000萬元,今年初將其全部股份轉(zhuǎn)讓,獲利2.27億元,賺了3.54倍。

即便是在Pre-IPO輪新進(jìn)入的股東,也賺到了不錯(cuò)收益。摩爾線程Pre-IPO輪投后估值為298.45億元,開盤市值約3055億元,新股東浮盈9倍以上。

顯然,在國(guó)產(chǎn) GPU 飛速前進(jìn)的大背景里,這臺(tái)造富機(jī)器顯然還沒停下。下一段故事,大概才剛剛開始。

文/董武英

       原文標(biāo)題 : 5年狂賺5825倍!中國(guó)最像英偉達(dá)的公司終于上市了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)