訂閱
糾錯
加入自媒體

算力不夠,智慧來湊?Deepseek們正在擺脫算力崇拜

圖片

算力神話正在松動

在科技圈,硅谷一直有一種“造物主”般的傲慢。從大模型誕生那天起,OpenAI的 CEO奧特曼就給全世界洗腦了一套暴力美學(xué):智能等于算力,算力等于顯卡,顯卡等于成功。

但這套邏輯,正在被一群中國“算法瘋子”拆解。

近日, Google的一項研究發(fā)現(xiàn),DeepSeek的R1和阿里云的qwq-32B模型,竟然能夠模仿人類的集體智能。

簡單說,在處理難題時,不再是一個人在戰(zhàn)斗,而是在內(nèi)部演化出了一個“思想社會”。其中不同人格特征和領(lǐng)域?qū)I(yè)知識的相互作用產(chǎn)生了更強大的能力。

大模型行業(yè)從不缺“堆料者”,但能讓 Google 彎下腰來研究底層邏輯的,寥寥無幾。這不僅是技術(shù)的勝利,更是中國企業(yè)在算力圍堵下,硬生生走出的一條“暴力效率主義”血路。

Deepseek更懂“省錢”

長期以來,硅谷的大模型發(fā)展路徑高度趨同甚至單一:堆最貴的卡,組最多的集群,投入最激進(jìn)的資本。

從 GPT-3 到 GPT-4,再到 GPT-4o,這條路線被一次次驗證有效。Meta 為了 Llama 3 囤積了數(shù)十萬張 GPU,微軟與 OpenAI 推進(jìn)的“星際門”項目,投資規(guī)模動輒以千億美元計,覆蓋算力、數(shù)據(jù)中心、電力基礎(chǔ)設(shè)施等全鏈條。這種打法并不復(fù)雜,本質(zhì)上是通過資源冗余換取確定性領(lǐng)先。

換句話說,當(dāng)算力足夠便宜、資本足夠充裕時,工程效率往往并非首要約束,真正重要的是“規(guī)模先到位”。

但 Google 這份研究揭開了另一個真相:DeepSeek 們之所以強,不是因為它們比 OpenAI 更能燒錢,而是它們更懂“省錢”。

研究指出,DeepSeek 等中國模型的能力躍遷,并非來自算力規(guī)模的指數(shù)級擴張,而是來自推理階段內(nèi)部結(jié)構(gòu)的重構(gòu)。

這些模型在面對復(fù)雜指令時,并不是沿著單一生成路徑一路向前,而是會在內(nèi)部并行展開多種解題策略,并通過持續(xù)的內(nèi)部比較、博弈與修正,逐步收斂到更穩(wěn)定的答案。

這種近似“多代理協(xié)商”的模式,并不追求單次推理速度的極限,卻顯著降低了單位算力下的錯誤率與返工成本。在算力受限的環(huán)境中,這種“少走彎路”的能力,往往比“跑得更快”更重要。

正是在這一背景下,MoE與 GRPO等技術(shù)路徑開始在國內(nèi)模型中被高度重視。MoE 通過將模型能力拆分給不同“專家模塊”,避免了每一次推理都全模型啟動;GRPO 則通過分組對比和相對優(yōu)化,提升模型在推理階段的穩(wěn)定性和可控性。

這類技術(shù)選擇的共同目標(biāo)只有一個:把有限算力的“智能產(chǎn)出”榨到極致。

這并不是一次偶然的技術(shù)選擇,而是一種被現(xiàn)實約束反復(fù)塑造出的工程哲學(xué)。

如果說硅谷仍在押注“重裝推進(jìn)”的工業(yè)化路線,那么中國模型更像是在修煉一套輕量而高效的技術(shù)體系。通過結(jié)構(gòu)、策略和調(diào)度上的精細(xì)設(shè)計,對沖算力劣勢。

這種“算法效率主義”并非理想主義,而是一種典型的生存型進(jìn)化。當(dāng)資源不再無限供給,效率本身就會從加分項,轉(zhuǎn)變?yōu)樽詈诵摹⒁沧铍y復(fù)制的競爭壁壘。

大廠護(hù)城河的坍塌

在 Google 的研究案例中,被反復(fù)引用的中國模型,并不是聲量最大、發(fā)布會最密集的玩家,而是 DeepSeek和阿里通義千問。這并非簡單的“技術(shù)偶然”,而是中國 AI 競爭的“分水嶺”已經(jīng)出現(xiàn)了。

過去兩年,國內(nèi)大廠們沉迷于參數(shù)對標(biāo)、榜單排名和在發(fā)布會上“吊打 GPT-4”,忙著在朋友圈曬各種看不懂的榜單,這些能在短期內(nèi)贏得更多注意力。

但從基礎(chǔ)研究和工程演化的角度看,這種競爭方式的邊際價值正在快速下降。真正進(jìn)入全球研究視野的,反而是那些持續(xù)在模型架構(gòu)、推理效率和成本結(jié)構(gòu)上做“臟活累活”的團(tuán)隊。

DeepSeek 背靠幻方量化,其技術(shù)團(tuán)隊長期浸泡在金融工程語境中,對算力成本、延遲控制和穩(wěn)定性有著近乎苛刻的要求。在量化交易領(lǐng)域,算力從來不是無限變量,“如何用更少計算得到更可靠結(jié)論”本身就是核心能力。

因此,DeepSeek 從一開始就沒有將重心放在應(yīng)用層敘事上,而是持續(xù)死磕推理成本與模型結(jié)構(gòu)。即便沒有萬卡集群,只要架構(gòu)足夠聰明,依然可以逼近前沿能力。

圖片

而阿里通義千問所選擇的路徑,則更具平臺型特征。

通過持續(xù)開源模型底座,阿里將模型訓(xùn)練、評測和場景驗證的一部分成本,轉(zhuǎn)化為全球開發(fā)者的協(xié)同實驗。這種做法短期內(nèi)看似削弱了“獨占優(yōu)勢”,但從長期看,卻顯著加快了模型在真實復(fù)雜場景中的演化速度。

在這種開放體系中,模型更容易暴露問題,也更快完成修正,從而在模擬“集體智慧”與復(fù)雜決策方面走得更遠(yuǎn)。

反觀某些還沉溺于做“套殼應(yīng)用”或只顧著買流量的大廠,護(hù)城河正在變得搖搖欲墜。應(yīng)用層的繁榮,建立在底層能力外包的基礎(chǔ)之上,一旦底層模型的差距被拉開,應(yīng)用層的優(yōu)勢往往難以長期維持。

互聯(lián)網(wǎng)行業(yè)從不缺跨界者,但真正成功的寥寥無幾。因為底層邏輯一旦錯位,再多的產(chǎn)品包裝也只是階段性繁榮。

在 AI 領(lǐng)域,如果不能在算法或架構(gòu)層貢獻(xiàn)新的認(rèn)知與方法論,那么競爭最終只會被壓縮到應(yīng)用層的價格戰(zhàn)與內(nèi)卷之中,而這,恰恰是最容易被后來者顛覆的地帶。

智能的“社會化”

Google 的這項研究,最細(xì)思極恐的地方在于:如果 AI 內(nèi)部已經(jīng)能模擬“集體智慧”,那么人類精英的價值還剩下多少?

研究提到,DeepSeek R1 等模型展現(xiàn)出的“內(nèi)部辯論”能力,本質(zhì)上,這意味著人類組織中大量依賴流程協(xié)作的崗位,將不可避免地被重新定義。

過去,一個大型企業(yè)的重大決策,往往需要多個部門參與:市場調(diào)研、戰(zhàn)略分析、風(fēng)險評估、財務(wù)測算……

而現(xiàn)在,一個具備強推理能力的 AI Agent,已經(jīng)可以在內(nèi)部完成成百上千次模擬。

這并不是“自動化”,而是決策機制的內(nèi)化。

對于字節(jié)跳動、美團(tuán)、百度這類高度依賴數(shù)據(jù)與算法的公司而言,這意味著從“人機協(xié)作”向“機機協(xié)作”的過渡。

對于制造業(yè)巨頭,如小米、比亞迪而言,這意味著供應(yīng)鏈與生產(chǎn)系統(tǒng)將第一次擁有“自反能力”。

它們不只是執(zhí)行命令,而是能夠?qū)γ畋旧硖岢鲑|(zhì)疑。

這也是為什么,越來越多企業(yè)開始將強推理模型引入非前端場景。不是為了聊天,而是為了判斷。

回到最初的問題:算力不夠,智慧真的能來湊嗎?

DeepSeek 與 千問給出的答案是:當(dāng)資源不再無限,智慧才會被迫進(jìn)化。

歷史反復(fù)證明,真正改變世界的技術(shù)路徑,往往誕生于約束之中,而不是溫室里。

今天,中國 AI 正在用一種并不張揚、卻高度有效的方式,重寫大模型的競爭邏輯。

它未必最快,但可能更穩(wěn);未必最貴,但更可持續(xù)。

而這,或許正是下一階段智能競爭的關(guān)鍵分水嶺。

馬斯克曾多次強調(diào):“未來所有的工作都將由 AI 完成,除非你想為了興趣而工作。”當(dāng)中國 AI 提前摸到了“集體智慧”的門檻,這種預(yù)測正加速從科幻變?yōu)楝F(xiàn)實。

       原文標(biāo)題 : 算力不夠,智慧來湊?Deepseek們正在擺脫算力崇拜

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號