訂閱
糾錯
加入自媒體

深扒Minimax與智譜:大模型,一場算力強度與融資耐力的殘酷絕殺?

26年初ChatGPT發(fā)布三年之際,中國兩大AI大模型創(chuàng)業(yè)公司Minimax和智譜幾乎同時,均以大約60億美金的估值上市,且上市后都以暴漲,并帶動整個AI應(yīng)用的普漲行情。但同時,扒開兩個大模型公司的報表,都是“虧無止境”的面相。

一邊是全球大模型瘋狂卷價格、越來越多大宗商品,一邊是模型無底洞的研發(fā)投入,但同時還有這種即翻倍的盛景。冰火交織下,海豚君一直的疑問是大模型到底是一種什么樣的生意。

這次,海豚君就結(jié)合兩個上市的公司數(shù)據(jù),來認真探討一下這個問題:

1)大模型到底需要怎樣的投入要素和密度?

2)算力到底扮演了什么角色?

3)模型經(jīng)濟學(xué)如何算,才能平衡?

4)最終,大模型到底是怎樣的生意模式?

以下是詳細分析

一、拔高的收入、驚悚的投入

兩個大模型公司Minimax和智譜,都是“短小精悍”型——人手少、產(chǎn)品迭代快,收入增長快。人數(shù)到2025年下半年沒超一千人,收入零起步,兩三年年化收入都在快速邁向一億美金。

但到了支出層,再高增的收入都被兇猛的投入比得相形見絀:即使收入增長過程中,Model to B公司智譜持續(xù)保持在50%的高毛利,還是Model to C公司Minimax毛利率翻正。

2024年兩個公司的支出(成本與運營開支)加總基本在當(dāng)期收入的10倍上下。Minimax 2025年前九個月收入快速做大后支出仍然是收入的5倍以上;而智譜到了2025年上半年看起來反而更加規(guī)模不經(jīng)濟了。

這里的核心問題是,對于模型公司而言,到底收入越大、虧損率收窄,還是收入越大、虧損率越高的規(guī)模不經(jīng)濟結(jié)局?

模型經(jīng)濟學(xué)的底層三要素——數(shù)據(jù)、算力、算法,大家已耳熟能詳。但要解答模型到底適不適用互聯(lián)網(wǎng)規(guī)模經(jīng)濟規(guī)模,關(guān)鍵是理解大模型到底需要怎樣的投入密度。

在大語言模型訓(xùn)練中,用了什么訓(xùn)練數(shù)據(jù)從來沒有模型廠真正公開,但這個問題大致有這么兩個共識; a.公共語料庫有百科、代碼庫、Common Crawl語料庫等; b.但公共和標準語料庫幾乎已被模型訓(xùn)練完畢。

到了2026年,大模型公司開始依賴合成數(shù)據(jù)和思維連數(shù)據(jù)。但未來,要給模型投喂更多數(shù)據(jù),要么靠自身超快的落地速度去接入更多場景;要么大模型公司本有自有數(shù)據(jù),比如說互聯(lián)網(wǎng)大廠更具數(shù)據(jù)優(yōu)勢;剩下就是比拼對私有數(shù)據(jù)的付費能力。

但數(shù)據(jù)投喂量因涉及數(shù)據(jù)合規(guī)和隱私等,沒有模型廠會在報表中展示。真正能體現(xiàn)在報表端的,主要是算力和算法,算法的精進本質(zhì)是靠人,算力對應(yīng)的是芯片和云服務(wù)。對于這兩個問題,我們就一個一個來看一下。

二、人太貴了?不是核心問題!

兩個公司員工整體都沒超1000人,尤其是Minimax都不足400人;兩家公司研發(fā)人員都接近75%,單人頭月成本6.5-8.5萬元人民幣(不含期權(quán)激勵),其中Minimax研發(fā)人員單人月成本是16萬。

Minimax因人員更為精煉,收入做大過程中,薪資支出至少已能夠收入覆蓋。而智譜因為商業(yè)變現(xiàn)上主要是to B落地,需要匹配更多銷售人員;而且研發(fā)上對通用模型著力更高,所以人力成本改善并不明顯。

其實,從這兩家公司可以看出,大模型在人力上的投入,更多是人才“腦力”密度的投入,而非人力密度的投入。甚至從Minimax的人才密度,可能已經(jīng)預(yù)示了AI時代互聯(lián)網(wǎng)公司的人力結(jié)構(gòu)雛形:

少而精的大模型研發(fā)人才,大量其他的部門崗位都在被模型取代(Minimax旗下AI產(chǎn)品眾多,但并未對應(yīng)超大的人頭量),總體薪資呈現(xiàn)出單人薪資超高,但總體可控的狀態(tài)。

比如Minimax一年總薪資支出大約1億美金(大約收入的90%上下),考慮到這兩家公司基座模型的迭代能力和多模態(tài)的發(fā)布速度、海外AI動輒上億美金的搶人戰(zhàn)慘烈程度(動輒挖一人開出的薪資就上億美金),這樣的人員支出還不算夸張。

三、核心矛盾:創(chuàng)收 vs 投入,到底能有平衡的時候嗎?

雖然薪資成本基本已經(jīng)把當(dāng)期的收入“吃光了”。相比于算力投入,人力薪資只是小菜一碟。薪資至少可以隨著收入的擴張而有效稀釋,但算力投入從兩家目前的情況看下來,是一個比收入增長斜率更高的投入類型。

而且從報表上來看,由于Minimax和智譜固定資產(chǎn)開支都非常少,幾乎可以確定,兩家公司的算力都是使用的第三方云服務(wù),這種相對輕資產(chǎn)的模式,而非OpenAI高度自控數(shù)據(jù)中心的方式。

大模型公司的報表中,算力的使用都分為了訓(xùn)練算力和推理算力。

模型在訓(xùn)練階段,就等于要做出來一個可以產(chǎn)生經(jīng)濟效益的商品和服務(wù),需要做研發(fā)投入,在產(chǎn)品投用(模型進入推理場景)之前,對應(yīng)的模型訓(xùn)練支出,都是推出產(chǎn)品之前的“沉淀支出”,計入研發(fā)費用當(dāng)中。

而研發(fā)好的模型投入了推理使用場景中,產(chǎn)生的收益記為收入,而推理階段模型對于算力的消耗,就記為收入創(chuàng)造過程中的直接成本,記在成本項當(dāng)中。

背后的邏輯也簡單:大模型公司砸人、砸算力、砸數(shù)據(jù)先在實驗室里做模型的研發(fā),這個是無論模型是否做出為客戶所用,是模型公司都必須要做“沉淀投入”。

只有當(dāng)模型被研發(fā)出來,可以用到推理環(huán)節(jié),無論是客戶調(diào)用模型接口還是自己直接用模型做出來APP來產(chǎn)生收入,才會產(chǎn)生推理收入和推理計算的成本。

這Minimax和智譜兩家公司來看,為了研發(fā)模型,單單訓(xùn)練算力投入全部占到了總支出的50%以上,是開支的絕對大頭,也是妥妥的“吸金黑洞”,貢獻了兩家公司5-10倍虧損率中的一半以上的支出。

這一占比,直接量化了海豚君在《AI泡沫“原罪”:英偉達是AI戒不掉的“興奮劑”?》中所說的算力吸空產(chǎn)業(yè)鏈利潤的說法。

再拿收入創(chuàng)造和模型訓(xùn)練投入相比,就更能直觀感受到訓(xùn)練投入的強度了:

從Minimax來看,2024年創(chuàng)收只有23年模型訓(xùn)練算力投入的65%,25年前三季度雖然收入成長很快,但也對24年同期訓(xùn)練算力成本覆蓋能力反而進一步降低到了50%;智譜到25年上半年更是僅有30%的覆蓋率。

Minimax由于產(chǎn)品落地上,以海外to C情感AI陪聊為主,設(shè)計上有很多游戲和互聯(lián)網(wǎng)增值的變現(xiàn)模式(詳細產(chǎn)品和商業(yè)化落地會另外詳細分析),to C的互聯(lián)網(wǎng)規(guī)模效應(yīng)+海外付費能力較強,收入對訓(xùn)練成本情況壓力尚小一些。

但智譜的情況就是一個非常明顯的收入高增,但對訓(xùn)練成本的回收能力,因為訓(xùn)練成本增長斜率更高,反而越來越弱。

這兩年趨勢看,雖然兩家作為中國獨立模型公司的佼佼者,收入增長斜率都很高,但當(dāng)年創(chuàng)收對上一年研發(fā)投入的代償全都不盡如人意。

這兩年趨勢看,雖然兩家作為中國獨立模型公司的佼佼者,收入增長斜率都很高,但當(dāng)年創(chuàng)收對上一年研發(fā)投入的代償全都不盡如人意。

模型要優(yōu)秀,訓(xùn)練成本就越高;收入跑得再快,也跟不上一代更比一代高的模型投入。那么矛盾來了,模型越做越虧,這種生意如何理解商業(yè)價值?

四、大模型到底是怎樣的商業(yè)模式?

大模型動輒1000%的虧損率,再次形象地說明了它的研發(fā)是一個人才+算力+數(shù)據(jù)三重密集的商業(yè)模式。

強投入和快迭代的共振,在海豚君看來,本質(zhì)上是把一個強資產(chǎn)負債表的資金密集性業(yè)務(wù),做成了“全長在”利潤表上的生意。

而當(dāng)它具備長期的經(jīng)濟和商業(yè)價值的時候,就是模型回歸成真正的“資產(chǎn)負債表”業(yè)務(wù)——模型不再需要年年投,而是投一年的訓(xùn)練成本可管之后10年甚至20年,讓模型持續(xù)產(chǎn)生收入。這個時候,訓(xùn)練成本可以做長期攤銷的時候,也只有這樣,模型研發(fā)的訓(xùn)練成本才會有研發(fā)資本化的真正商業(yè)基礎(chǔ)。具體來看:

1)算力:節(jié)節(jié)高的“固定資產(chǎn)投入”

Minimax和智譜為例,23年研發(fā)一代模型,訓(xùn)練成本要四、五千萬美金之間; 而下一代模型的訓(xùn)練要實現(xiàn)代際的線性差異,在數(shù)據(jù)量、模型參數(shù)量和算力投入反而是指數(shù)級的提升。最終算力效率提升,反而拉高了算力的總需求量。

從這兩家公司來看,模型升級一代,訓(xùn)練成本基本要提高3-5倍。

當(dāng)下大模型的競爭節(jié)奏,基本都是一年出一代模型。也就是說之前一年訓(xùn)練出的模型,只對應(yīng)接下來一年的推理創(chuàng)收期。

這么高的算力投入,沒有辦法做攤銷折舊,只能全部計入當(dāng)期的研發(fā)費用當(dāng)中,結(jié)果就是上文高于收入5-10倍的虧損這種 “慘不忍睹”的虧損率。

2)快迭代:收入vs 投入,追不上的“貓鼠游戲”?

智譜和Minimax兩家公司面臨的共同情況都是,模型的創(chuàng)收能力尚且覆蓋無法模型的算力投入。雖然收入跑不過訓(xùn)練成本,一邊狂虧一邊狂投,幾乎是研發(fā)大模型必然的宿命。

為了讓自己活到黎明時刻,公司要把這代模型的創(chuàng)收,再考慮上研發(fā)薪資支出,幾乎要再貼上高于收入3-5倍的融資資金,才能為下一代的模型研發(fā)續(xù)命,以保證模型不被市場淘汰。

而這樣一直滾雪球下去,就是一個收入一直追不上未來投入;且只要還在大模型競爭的牌桌上,就需要不斷融資,而且越做大、融資窟窿越大的“資本比拼”游戲。

3)縮放定律失效:資本游戲結(jié)束?

一個自然而然的問題是,這么下去,到底什么時間才是個頭?很顯然,在成本端投入巨大的情況下,這里矛盾的核心已不是簡單的收入成長速度能否匹配訓(xùn)練成本增速的問題,更加重要的問題是,什么時間模型不需要這么大的投入,或者迭代速度不需要這么快了。

對于大模型技術(shù)本身而言,不需要投入的時候,其實就是縮放定律(scaling law)失效的時候,換句話說,當(dāng)增加一點點的智力所需要的算力開始暴漲式上升的時候,模型訓(xùn)練的必要性就不大了。

模型不再需要高頻的訓(xùn)練來迭代,也意味著高密集的訓(xùn)練重資產(chǎn)投入告一段落。算力投入一代新模型后,這代模型能有10年甚至更長的時間來創(chuàng)收。甚至當(dāng)模型不再需要訓(xùn)練投入,但大模型能夠一直創(chuàng)收,這時一個類似“長江電力”的商業(yè)模式也就呼之欲出了。

但這個假設(shè)的基本前提是,頭部大模型廠商在長期的資本、人力和數(shù)據(jù)消耗戰(zhàn)中,已經(jīng)熬死了一眾對手,僅剩的幾個對手之間達成默契,不再打價格戰(zhàn),最終形成類似當(dāng)下云服務(wù)市場一樣、市占率高度集中的寡頭市場,那么大模型的商業(yè)模式自然也就立住了。

4)終局之前,是殘酷的資本游戲

但縮放定律失效時刻到來之前,大模型公司會是持續(xù)的吞金獸。這種情況下,商業(yè)模式的競爭本質(zhì)上就變成了一場持續(xù)融資的資本競賽。

當(dāng)然,如果像蔚來一樣,真有大模型公司能把融資做成一種差異化的生存能力,確實也是一項核心技能。但對于大多數(shù)公司而言,融資不是博傻游戲,資金愿意融資,本身是要看企業(yè)的產(chǎn)品和執(zhí)行能力,能融到資金,而且估值越來越高,本身也是一個雙向選擇的過程。

按媒體報道,中國的模型之戰(zhàn),也已經(jīng)從剛開始的百模之戰(zhàn)走到基模五強——字節(jié)、阿里、階躍、智譜和DeepSeek。

原本的模型創(chuàng)業(yè)“六小龍”階躍、智譜、MiniMax、百川智能、月之暗面與零一萬物中,在DeepSeek一夜爆紅并用完全的開源顛覆了模型收費之后,零一萬物和百川智能已經(jīng)掉隊。

海外同樣也已經(jīng)變成五虎爭霸:OpenAI、Anthropic、谷歌Gemini、xAI和 Meta Llama,甚至Meta的模型也已經(jīng)落后。

一些能夠持續(xù)融資且估值能夠水漲船高、有一些在快速的死在了半路上。從大模型生存的路徑來看,融資能力背后真正的是核心人才、模型實力和產(chǎn)品落地進度能力綜合作用的結(jié)果。

核心人才是AI的上億美金搶人大賽,這個還是持續(xù)進行中,而另外兩個一個看模型本身智能化程度,而另外一個最終要落地到創(chuàng)收能力上。

1)模型實力:

從下文可以看到,模型創(chuàng)業(yè)公司能生存下來,大多在模型的榜單上能找得到名字,這背后是模型在各個細分顆粒度上(模型智能化程度、幻覺率、模型參數(shù)、回答時首個Token輸出前的等待時長等)的競爭相對靠前。

2)產(chǎn)品落地能力

過去一年中,多數(shù)獨立創(chuàng)業(yè)公司,要么在與互聯(lián)網(wǎng)大廠競爭中被挖走了人,要么產(chǎn)品落地上創(chuàng)收困難,要么是模型價格比拼中,干不過性價比高的開源模型,模型隱沒在了半路上。

如果用一句話來概括的話,在Scaling Law撞墻的“黎明時分”之前,甚至到來之后的一段時間內(nèi),我們都會看到一個個模型在“人才搶奪、模型研發(fā)和產(chǎn)品落地”三維度的比拼中,一個個倒下去。

而真正能走向決賽的,除了看人和背后的資金實力,更加重要的是看模型研發(fā)的進度和產(chǎn)品落地的水平。

下一篇分析,海豚君就會圍繞智譜和Minimax的模型和產(chǎn)品落地,來理解如何去評價大模型的資本市場價值。

- END -

// 轉(zhuǎn)載開白

本文為海豚研究原創(chuàng)文章,如需轉(zhuǎn)載請獲得授權(quán)。

// 免責(zé)聲明及一般披露提示

本報告僅作一般綜合數(shù)據(jù)之用,旨在海豚研究及其關(guān)聯(lián)機構(gòu)之用戶作一般閱覽及數(shù)據(jù)參考,並未考慮接獲本報告之任何人士之特定投資目標、投資產(chǎn)品偏好、風(fēng)險承受能力、財務(wù)狀況及特別需求投資者若基於此報告做出投資前,必須諮詢獨立專業(yè)顧問的意見。任何因使用或參考本報告提及內(nèi)容或信息做出投資決策的人士,需自行承擔(dān)風(fēng)險。海豚研究毋須承擔(dān)因使用本報告所載數(shù)據(jù)而可能直接或間接引致之任何責(zé)任或損失。本報告所載信息及數(shù)據(jù)基於已公開的資料,僅作參考用途,海豚研究力求但不保證相關(guān)信息及數(shù)據(jù)的可靠性、準確性和完整性。

本報告中所提及之信息或所表達之觀點,在任何司法管轄權(quán)下的地方均不可被作為或被視作證券出售邀約或證券買賣之邀請,也不構(gòu)成對有關(guān)證券或相關(guān)金融工具的建議、詢價及推薦等。本報告所載資訊、工具及資料並非用作或擬作分派予在分派、刊發(fā)、提供或使用有關(guān)資訊、工具及資料抵觸適用法例或規(guī)例之司法權(quán)區(qū)或?qū)е潞k嘌芯考埃蚱涓綄俟净蚵?lián)屬公司須遵守該司法權(quán)區(qū)之任何註冊或申領(lǐng)牌照規(guī)定的有關(guān)司法權(quán)區(qū)的公民或居民。

本報告僅反映相關(guān)創(chuàng)作人員個人的觀點、見解及分析方法,並不代表海豚研究及/或其關(guān)聯(lián)機構(gòu)的立場。

本報告由海豚研究製作,版權(quán)僅為海豚研究所有。任何機構(gòu)或個人未經(jīng)海豚研究事先書面同意的情況下,均不得(i)以任何方式製作、拷貝、複製、翻版、轉(zhuǎn)發(fā)等任何形式的複印件或複製品,及/或(ii)直接或間接再次分發(fā)或轉(zhuǎn)交予其他非授權(quán)人士,海豚研究將保留一切相關(guān)權(quán)利。

       原文標題 : 深扒Minimax與智譜:大模型,一場算力強度與融資耐力的殘酷絕殺?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號