123,123,123

5年狂賺5825倍！中國最像英偉達(dá)的公司終于上市了

2025-12-05 18:43

烏鴉智能說

關(guān)注

今天，A股上演了一場真正的“印鈔狂歡”。

被大家念叨了很久的“國產(chǎn)GPU第一股”——摩爾線程，終于登陸科創(chuàng)板了。

你看這股價(jià)，首日一度高開468.78%，開盤價(jià)每股650元，市值一度突破3000億元。

在這波狂歡里，創(chuàng)始人張建中贏麻了，僅直接持股市值就達(dá)287.56億。早期投資人也賺得盆滿缽滿。最早的投資人沛縣乾曜累計(jì)浮盈高達(dá)5825倍。

在2020年12月，和而泰投了摩爾線程3000萬，現(xiàn)在變成了26.68億，5年時(shí)間直接漲了近88倍。

資本為什么這么瘋狂？就沖著它腦門上那個(gè)全市場最性感的標(biāo)簽—— “中國版英偉達(dá)”。

這可不是瞎貼金。摩爾線程的班底那可是正兒八經(jīng)的“英偉達(dá)嫡系”，張建中更是長期擔(dān)任英偉達(dá)全球副總裁、中國區(qū)總經(jīng)理。

借助這個(gè)熱乎勁，今天我們就來盤一盤，這家被捧上神壇的公司，成色到底怎么樣？

/ 01 /

5年4代GPU，最新性能接近英偉達(dá)H20

顯卡這玩意兒，如果不談場景只談參數(shù)，那就是在耍流氓。

咱們把話說明白點(diǎn)。

搞AI計(jì)算，核心指標(biāo)其實(shí)就看三個(gè)：算力、顯存、帶寬。

顯存決定了你能處理的模型大小，算力代表著能同時(shí)處理多少數(shù)據(jù)，帶寬則代表固定期限能傳輸多少數(shù)據(jù)。

如果顯存不夠，大模型直接跟你說拜拜，就像小顯卡跑3A大作直接爆顯存一樣，不講道理。

如果算力和帶寬不夠，那就是老牛拉破車，別人跑完了，你還在那loading。

好，鋪墊完了，咱們來看看摩爾線程。

自2020年成立以來，摩爾線程已推出“蘇堤”、“春曉”、“曲院”、“平湖”四代GPU架構(gòu)，從第三代曲院開始重心轉(zhuǎn)向AI計(jì)算，最新一代“平湖”GPU于2024年發(fā)布，基于該GPU的S5000的最新產(chǎn)品。

看數(shù)據(jù)，S5000在FP32精度下的算力是32 TFLOPS。同時(shí)，平湖架構(gòu)GPU最大顯存容量推斷為80GB，推斷S5000顯存容量應(yīng)為80GB，帶寬未知。

這是什么概念？咱們拉出英偉達(dá)的GPU看看：A100的FP32算力是19.5，H20是44，H100是67。

單看FP32這一項(xiàng)，S5000一拳打翻了A100，甚至快摸到了H20的尾巴。雖然離H100那種“怪物”還有差距，但看著是不是挺熱血沸騰？

且慢，先別急著開香檳。

上面的參數(shù)并不能代表S5000的實(shí)際AI算力水平，原因就出在這個(gè)“FP32”上。

AI計(jì)算中，需要用到不同精度的數(shù)據(jù)，F(xiàn)P32是其中一種，此外還有FP64、FP16/BF16、FP8、FP4、INT8等多種常見數(shù)據(jù)類型。

字母后面的數(shù)字代表在存儲里占用的字節(jié)，數(shù)字增大，數(shù)據(jù)精度評估。FP32能表示小數(shù)點(diǎn)后7位左右，F(xiàn)P16能達(dá)到小數(shù)點(diǎn)后3位左右，INT8能表示-128到127之間的整數(shù)。

相應(yīng)的，數(shù)據(jù)位數(shù)越大，占用內(nèi)存越大，計(jì)算速度也更慢。因此，不同AI任務(wù)需要找到最合適的數(shù)據(jù)類型，像醫(yī)學(xué)、軍事、科學(xué)等領(lǐng)域?qū)φ`差比較敏感的，就需要用到FP64數(shù)據(jù)。

現(xiàn)在的AI大模型，不是在那搞火箭軌道計(jì)算，所以不需要那么高的精度。

現(xiàn)在大家為了快，為了省內(nèi)存，都在搞混合精度。FP16、BF16，甚至FP8（8位浮點(diǎn)）才是現(xiàn)在AI訓(xùn)練和推理的“主戰(zhàn)場”。

就像你切菜，不需要拿著做眼科手術(shù)的手術(shù)刀去切，拿著菜刀（FP8/FP16）反而砍得更快。

所以，S5000那個(gè)漂亮的FP32數(shù)據(jù)，在AI領(lǐng)域里，參考價(jià)值得打個(gè)折。關(guān)鍵得看它在FP16或者FP8下的表現(xiàn)。

關(guān)于這點(diǎn)，有媒體曾經(jīng)披露過，據(jù)參與S5000產(chǎn)品測試的人士透露，S5000是國內(nèi)真正對標(biāo)H100的產(chǎn)品，其FP8計(jì)算能力對DeepSeek-V3/R1這樣的MoE大模型訓(xùn)練“是個(gè)絕配”。

但由于相關(guān)信息較少，摩爾線程S5000的實(shí)際表現(xiàn)仍未可知。

再看看隔壁的友商們，那也是卷得飛起。

華為昇騰910C NPU目前公布的BF16/FP16總算力達(dá)752 TFLOPS，超過了英偉達(dá)H20和A100，但不到H100的一半，片上內(nèi)存（可簡單類比顯存）和帶寬與H100基本在同一水平。

寒武紀(jì)目前在售思元590芯片，F(xiàn)P16算力為256TFLOPS，接近A100水平。沐曦集成未公布數(shù)據(jù)，僅表示曦云C500和C550兩款GPU在FP16/BF16指標(biāo)上，處于英偉達(dá)A100的算力區(qū)間。

不過，也有行業(yè)內(nèi)部人士稱，在實(shí)際訓(xùn)練推理環(huán)境中，摩爾線程等國產(chǎn)AI計(jì)算卡的紙面參數(shù)算力往往需要打個(gè)折扣。

必須承認(rèn)，單看指標(biāo)，摩爾線程離英偉達(dá)確實(shí)還有很長的路要跑。

但這不重要，重要的是它還在跑。在他們身上，我們把國產(chǎn)GPU死磕到底的那股勁兒。只要還在往前拱，這件事就有戲。給點(diǎn)耐心，挑戰(zhàn)者永遠(yuǎn)值得瑞思拜。

/ 02 /

一個(gè)S5000集群，貢獻(xiàn)一半以上營收

雖然大家都說摩爾線程是“國產(chǎn)英偉達(dá)”，但只要你翻開本本，就會發(fā)現(xiàn)兩者的賺錢方式其實(shí)大有區(qū)別。

比較典型的體現(xiàn)是，英偉達(dá)不直接銷售AI智算集群，而摩爾線程主要營收卻來自于集群產(chǎn)品。

今年上半年，摩爾線程共賣出了5個(gè)智算集群，其中4個(gè)集成512個(gè)S4000 GPU，另一個(gè)是集成2048個(gè)S5000 GPU的集群，這也是摩爾線程賣出的第一個(gè)S5000集群。資料顯示，僅這一個(gè)S5000集群，就為摩爾線程貢獻(xiàn)了3.97億元營收，占上半年總營收一半以上。

據(jù)招股資料顯示，這一個(gè)S5000集群的客戶為“重大科技創(chuàng)新平臺”，大概率是某個(gè)國家實(shí)驗(yàn)室。值得一提的是，目前國產(chǎn)AI計(jì)算卡企業(yè)中，華為是絕對龍頭，客戶較為廣泛。寒武紀(jì)主要客戶為字節(jié)跳動，據(jù)行業(yè)內(nèi)人士透露，沐曦集成則主要面向信創(chuàng)GPU市場。

而英偉達(dá)之所以不賣AI智算集群的原因，是因?yàn)檫@事的毛利率比賣芯片可差多了。

現(xiàn)在，英偉達(dá)賣 GPU 的毛利率高達(dá)70%，而賣AI集群的毛利率可就要低很多，因?yàn)锳I 智算集群的建設(shè)和維護(hù)也需要大把的錢。

雖然毛利率低，可對于尚處于追趕階段的摩爾線程也不算一個(gè)壞的選擇。

因?yàn)橄啾扔谫uGPU，賣集群更容易做大營收規(guī)模。集群本質(zhì)上就是把一堆GPU連接在一起，共同執(zhí)行AI任務(wù)，賣一個(gè)集群就相當(dāng)于一次性賣出幾百上千甚至更多GPU。

更關(guān)鍵的是，賣集群這事也不是誰想干就能干的。

現(xiàn)階段AI模型越做越大，單卡或者多卡組合已經(jīng)滿足不了訓(xùn)練需求，同時(shí)消費(fèi)端推理需求暴增，AI大廠和云服務(wù)廠商只能建設(shè)更大的算力集群來滿足行業(yè)需求。

比如，馬斯克的xAI孟菲斯超級集群一期就集成了10萬張H100GPU，亞馬遜的Project Rainier更是集成了近50萬顆自研芯片。

AI計(jì)算是一場對速度的極致考驗(yàn)，每塊GPU類似一段高速公路，這些高速路段并沒有相連，每行駛一段就得出高速然后重新上另一段高速。

于是，當(dāng)GPU越來越多，就帶了另一個(gè)問題：怎么把這些GPU更好地連接起來？

這就引出了建設(shè)AI算力集群一個(gè)關(guān)鍵技術(shù)——GPU互聯(lián)技術(shù)。

英偉達(dá)之所以這么牛，是因?yàn)樗茉缇烷_發(fā)出來NVLink技術(shù)，相當(dāng)于把每段高速的連接路段也修成了高速，相鄰的幾張GPU兩兩互通，提升計(jì)算速度。目前應(yīng)用的NVLink5.0技術(shù)卡間互聯(lián)帶寬高達(dá)1.8TB/s，即將推出的6.0技術(shù)帶寬將升級至3.6TB/s。

在卡間互聯(lián)上，摩爾線程也推出了自研的MT-Link技術(shù)，目前最新的MT-Link3.0互聯(lián)帶寬達(dá)1.3TB/s，介于NVLink4.0（帶寬900GB/s）和5.0之間。招股資料中，摩爾線程表示MT-Link3.0已經(jīng)達(dá)到行業(yè)領(lǐng)先水平。

不過，公司也說了，目前摩爾線程最新的平湖GPU架構(gòu)和S5000 GPU上，用的還是MT-Link2.0技術(shù)，片間互聯(lián)帶寬為800GB/s。也就是說，新研發(fā)的3.0技術(shù)還沒應(yīng)用到產(chǎn)品上。

雖然摩爾線程在GPU互聯(lián)技術(shù)做得不錯(cuò)，但其AI集群也面臨著另一個(gè)現(xiàn)實(shí)挑戰(zhàn)，那就是規(guī)模。

一般來說，兩兩互聯(lián)的卡數(shù)量有著較難突破的物理極限。由于每家廠商采用的互聯(lián)結(jié)構(gòu)不同，這個(gè)極限并不相同，比如英偉達(dá)最新的Blackwell架構(gòu)支持72個(gè)GPU互聯(lián)，谷歌TPU在卡間互聯(lián)上最多形成4X4X4（即64個(gè)TPU）的小立方體，這樣的互聯(lián)極限一般被稱為節(jié)點(diǎn)。

摩爾線程現(xiàn)有的KUAE2集群技術(shù)，每個(gè)節(jié)點(diǎn)集成8顆模塊化GPU，節(jié)點(diǎn)之間采用的InfiniBand/RoCE的網(wǎng)絡(luò)方案進(jìn)行互聯(lián)，這兩種都是行業(yè)主流網(wǎng)絡(luò)互聯(lián)方案。KUAE2集群最多可包含1280個(gè)節(jié)點(diǎn)，最大可支持10240個(gè)GPU。

不過，摩爾線程賣出的最大集群僅包含2048張卡。據(jù)行業(yè)人士透露，在AI計(jì)算卡集群上，5000卡是一個(gè)關(guān)鍵瓶頸，因?yàn)榧阂?guī)模上去后，對電源、電力、散熱以及系統(tǒng)調(diào)控等諸多方面都是一個(gè)極大的考驗(yàn)。因此相比于動輒10萬卡、20萬卡互聯(lián)的英偉達(dá)，摩爾線程的KUAE集群技術(shù)仍需要進(jìn)一步完善及迭代。

雖然技術(shù)上還在追趕，離萬卡集群也還有距離。但在國產(chǎn)替代的大潮下，能把千卡級別的集群賣出去，而且真金白銀地賺到錢，已經(jīng)是一件很了不起的事情了。

只要有人買單，這把火，就還能繼續(xù)燒下去。

/ 03 /

5年5825倍的造富神話

除了國產(chǎn)GPU追趕英偉達(dá)的故事，摩爾線程上市另一個(gè)話題便是，造富。

最直接的體現(xiàn)就是創(chuàng)始團(tuán)隊(duì)。公告顯示，發(fā)行后張建中直接持股9.4127%，按上市首日的價(jià)格，即使不算間接持股，張建中持股市值就高達(dá)287.56億元。

最早下場的機(jī)構(gòu)股東同樣賺得盆滿缽滿。

摩爾線程成立三個(gè)月，深圳明皓、沛縣乾曜就迅速入局。據(jù)摩爾線程公布的法律意見書，沛縣乾曜是以1元的價(jià)格入股，投前估值僅1000萬元，沛縣乾曜以190.4762萬元入股，拿到了13.4%股份。同期入股的深圳明皓以35.28元的價(jià)格入股，投了8000萬元，拿到了16%股份。

之后，沛縣乾曜以253.60元的價(jià)格轉(zhuǎn)讓了近20萬元的注冊資本，套現(xiàn)約5000萬元。此次發(fā)行后沛縣乾曜仍持有1699.87萬股，占總股本的3.6165%，開盤市值為110.48億元，以此計(jì)算沛縣乾曜累計(jì)浮盈超5825倍。

深圳明皓先后在2021年10月和今年初分別套現(xiàn)了2000萬元和1.57億元，發(fā)行后持有1992.27萬股，持股比例為4.2386%，開盤市值為129.49億元，累計(jì)浮盈達(dá)163倍。

在之后的天使輪中，摩爾線程引入了紅杉資本、聞名泉豐、和而泰、深圳一創(chuàng)、五源啟興五家機(jī)構(gòu)。資料顯示，此輪融資投后估值為16.46億元，和而泰投了3000萬元。此次發(fā)行后和而泰持股比例為0.8734%，以開盤價(jià)計(jì)算持股市值26.68億元，增值了近88倍。

紅杉資本曾多次追投，天使輪、Pre-A輪和B輪合計(jì)投入約2.12億元，發(fā)行后持股1915.44萬股，持股比例為4.0752%，持股市值124.50億元，增值了近58倍。

不過也有在IPO前提前離場的機(jī)構(gòu)。字節(jié)跳動旗下量子躍動在Pre-A輪向摩爾線程投了約5000萬元，今年初將其全部股份轉(zhuǎn)讓，獲利2.27億元，賺了3.54倍。

即便是在Pre-IPO輪新進(jìn)入的股東，也賺到了不錯(cuò)收益。摩爾線程Pre-IPO輪投后估值為298.45億元，開盤市值約3055億元，新股東浮盈9倍以上。

顯然，在國產(chǎn) GPU 飛速前進(jìn)的大背景里，這臺造富機(jī)器顯然還沒停下。下一段故事，大概才剛剛開始。

文/董武英

原文標(biāo)題 : 5年狂賺5825倍！中國最像英偉達(dá)的公司終于上市了