訂閱
糾錯
加入自媒體

DeepSeek出招!AI小龍們重排座次,紅包大戰(zhàn)只是表象?

2026-02-13 10:38
雷科技
關(guān)注

紅包在前,模型在后。

2026新春(2).jpg

2026 年的馬年春節(jié),AI 的火藥味甚至蓋過了紅包味。

字節(jié)、阿里、騰訊幾乎同時把 AI 大規(guī)模推向臺前:紅包、免單、春晚互動、本地生活接入……都在爭入口。與此同時,BAT 三家也在基礎(chǔ)模型上連續(xù)出牌,視頻生成(Seedance 2.0)、圖像(Qwen-IMAGE-2.0)、多模態(tài)、語音模型密集更新,幾乎沒有空檔。

不過,基礎(chǔ)模型的對抗也從字節(jié)、阿里、騰訊等巨頭迅速蔓延到了 DeepSeek 和「AI 小龍」們。

2 月 11 日晚,DeepSeek 新模型版本全面上線,繼續(xù)把長上下文與復雜任務能力往前推;幾乎同一時間,智譜推出新一代旗艦 GLM-5,強調(diào) Agent 與編程能力;MiniMax 也帶來了 MiniMax M2.5,延續(xù)多模態(tài)與應用導向路線。

三家?guī)缀踉谕粫r間點出手,讓這場春節(jié) AI 大戰(zhàn)的「模型交鋒」又升級了一個檔位。

巨頭雙線推進,既搶入口也搶模型;創(chuàng)業(yè)公司聚焦底層能力,把籌碼壓在基礎(chǔ)模型上。真正決定 2026 年甚至未來幾年的競爭,正在這里展開。

春節(jié) AI 大戰(zhàn):前線發(fā)紅包,后端拼模型

2 月 12 日,阿里千問宣布「春節(jié) 30 億大免單」上線 6 天完成 1.2 億筆 AI 下單,用戶說了 41 億次。稍早前,騰訊元寶則宣布春節(jié)活動啟動 5 天,元寶 AI 生圖功能日均調(diào)用增長 30 倍,時長增長超 80%。

拼圖_美圖設計室 (4).jpg

圖片來源:千問、元寶

如果說今年春節(jié) AI 大戰(zhàn)前半段是純粹的入口之爭,后半段則是更為復雜,從巨頭到初創(chuàng)大模型公司,都在集中發(fā)力基礎(chǔ)模型的迭代。

這一點其實雷科技在之前的報道《一切為了Agent:千問、階躍、Gemini打響「3.5模型大戰(zhàn)」,春節(jié)將成關(guān)鍵節(jié)點?》就有提到,包括:

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;

- 國內(nèi)已經(jīng)發(fā)布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;

- 剛剛發(fā)布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;

- 還有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。

DeepSeek V4大招還沒發(fā),把「長上下文」做深是亮點

考慮到 DeepSeek 并沒有發(fā)布官方博文,這一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或為 V3.5)。

不過這也可以看作 V4 發(fā)布前的「灰度版」,因為按照 The Information 的最新爆料,DeepSeek V4 內(nèi)部初步測試顯示,其在模型的編程能力了已經(jīng)超越了 Claude(沒有指出具體模型)。

而從網(wǎng)友們統(tǒng)一收到的 DeepSeek 回復來看,DeepSeek 新模型的變化集中在兩點:百萬級長上下文和知識庫更新。

拼圖_美圖設計室.jpg

首先是上下文窗口從之前的 128K 直接拉升到了 1M(100 萬 Token),你可以一次性把《三體》全集或者一整個項目的代碼倉庫塞給它。測試顯示,它處理這類長文檔的響應速度非?欤辉傩枰謩硬鸱治募。

另外,DeepSeek 新模型的知識庫也更新到了 2025 年 5 月,但依然不支持多模態(tài)——無法理解圖片(文字內(nèi)容除外)和視頻,也符合 DeepSeek 一直堅持的「語言模型」路線:

不追求炫目的多模態(tài),而是把文本推理、工程任務這些高頻剛需做到極致。

而上下文長度的大幅提升,不僅長文檔處理與多輪推理能力更穩(wěn)定,理論上也會改善長代碼理解、多步驟分析等復雜場景執(zhí)行表現(xiàn)。

時隔 1 個多月迭代,智譜 GLM-5 把 Agent 推到臺前

截屏2026-02-12 17.27.59.png

相比之下,GLM-5 作為原生 Agent 基座模型的升級更具「代際感」。雖然距離去年底發(fā)布 GLM-4.7 僅僅過去 1 個多月,但智譜年初上市時候預告的新一代模型,確實升級不小。

這一代模型的核心關(guān)鍵詞不再是對話,而是 Agent 與編程能力,也規(guī)格已經(jīng)明顯向「Agent 基礎(chǔ)模型」靠攏:上下文達到 200K 級別,最大輸出可達 128K,模型規(guī)模進一步擴大,訓練體系也做了重構(gòu)。

但真正的變化還是發(fā)生在能力結(jié)構(gòu)上。

GLM-5.0 被直接設計為可執(zhí)行任務的 Agent 模型,強調(diào)編程能力、工具調(diào)用與長流程執(zhí)行。在編程測試中,它已經(jīng)能處理項目級代碼與調(diào)試問題,模型可以拆解需求、調(diào)用接口、持續(xù)執(zhí)行任務,并在多階段過程中保持目標一致。

繼續(xù)押注多模態(tài),MiniMax M2.5依然堅持生產(chǎn)至上

630126375_17943864630109729_2809887304480573042_n.jpg

MiniMax 從模型到應用的垂直路線,依舊與前兩者拉開距離。

MiniMax M2.5 的升級重點仍然放在多模態(tài)與內(nèi)容生成能力,但強調(diào)的一整套多模態(tài)能力的推進,包括語音生成、音樂生成與文本能力同步提升,強調(diào)可直接進入創(chuàng)作與產(chǎn)品流程。

模型繼續(xù)采用 MoE 架構(gòu),在保持規(guī)模的同時控制推理成本,更適合部署在應用側(cè)。語音克隆、情緒表達、音樂生成質(zhì)量的提升,使它更接近「生產(chǎn)工具」,而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比誰最聰明,而是更偏向讓模型在內(nèi)容生產(chǎn)環(huán)節(jié)真正可用,生成內(nèi)容、參與創(chuàng)作、進入產(chǎn)品流程。

這條路徑也決定了 MiniMax 的目標不是 benchmark,而是可落地的生產(chǎn)能力。

三家模型的路徑差異由此變得非常具體:DeepSeek 把長推理能力做到極致,智譜把模型推向 Agent 工程形態(tài),MiniMax 則把多模態(tài)生產(chǎn)能力做成基礎(chǔ)設施。它們不再圍繞同一套指標競爭,而是在不同能力方向上構(gòu)建各自的模型形態(tài)。

但共性同樣明顯。參數(shù)規(guī)模不再是核心賣點,聊天體驗也不再是主要目標,所有升級都在指向一件事——模型要能參與真實任務,而不僅是給出答案。

DeepSeek 炸場一年后,「AI 小龍」位次已劇變

把時間撥回到去年春節(jié),DeepSeek-V3 和 R1 的開源發(fā)布,沖擊了全球 AI 格局,也成為「AI 小龍」陣營的分水嶺。

關(guān)鍵不只是「模型很強」,更在于成本被重新定義。低成本、高性能的推理模型開始出現(xiàn)后,行業(yè)對基礎(chǔ)模型的預期突然變了——不只是要求嚴格訓練出一個模型,而是要求更低成本的更強模型。

劇烈的模型競爭加速,再加之訓練算力的匱乏,直接引發(fā)了「AI 小龍」陣營的明顯分化。百川和零一幾乎已經(jīng)退出「前沿基礎(chǔ)模型」的主戰(zhàn)場:前者轉(zhuǎn)向醫(yī)療等垂直方向,后者更多走企業(yè)與行業(yè)場景路線,更新節(jié)奏明顯放緩。

當基礎(chǔ)模型進入高投入、高密度迭代階段,只有極少數(shù)團隊還能長期承受算力與研發(fā)壓力。

不過今年的情況又有些不一樣,最直接的一點就是 DeepSeek V4 至今沒有發(fā)布。從外部看,可能有兩種解釋。

一種是技術(shù)層面的現(xiàn)實:推理能力、長上下文、工程穩(wěn)定性這些方向本身難度更高,模型要跨出一整代的差距,需要更長周期,而且之前也傳出過 DeepSeek 在訓練過程遇到難題。另一種則是更偏策略性,不只是跟著友商一起發(fā)布,而是作為壓軸登場,形成宣發(fā)上的優(yōu)勢。

還有一個更容易被忽略的變化是:今年春節(jié),DeepSeek 要面對字節(jié)、阿里、騰訊在模型上的高強度投入,以及全球模型的快速迭代,最直觀的例子就是最近引爆全球的字節(jié) Seedance 5.0 視頻模型。

IMG_idoqxw.gif

Seedance 5.0 生成,圖片來源:bilibili

當然,還在活躍的「AI 小龍」也在第一線持續(xù)推進基礎(chǔ)模型的迭代,智譜 GLM 和階躍星辰 Step 更多還是集中在模型,面向行業(yè)提供更創(chuàng)新、更實用的基礎(chǔ)模型。

MiniMax 和月之暗面 Kimi 則更多主打「模型即應用」,不只打造模型,也在發(fā)力自己的原生 AI 應用,MiniMax 更是形成了一定的產(chǎn)品矩陣,但二者都在從基礎(chǔ)模型到應用進行垂直整合。

這不是簡單的「誰強誰弱」,而是一種更現(xiàn)實的分化。

寫在最后

2026 年的春節(jié)還沒正式開始,但大模型下半場的發(fā)令槍已經(jīng)響得震耳欲聾。

從巨頭們的「撒幣」入口戰(zhàn),到 DeepSeek、智譜、MiniMax 在初四晚上的模型突襲,這場仗的打法變了。大家不再執(zhí)著于在 Benchmark 上刷分,而是開始比誰能更深地嵌入真實生產(chǎn)力:是吞下百萬行代碼的胃口,是自主跑通工程的雙手,還是理解人類情緒的耳朵。

DeepSeek 這次雖然沒祭出傳說中的 V4,但這記「1M 上下文」的長拳,依然也讓不少空談 Agent 卻解決不了長程記憶的對手感到脊背發(fā)涼。而智譜和 MiniMax 的如期對壘,則證明了「AI 小龍」們已經(jīng)從去年的防守反擊,轉(zhuǎn)向了更有底氣的差異化進攻。

懸念依然存在。DeepSeek 憋了許久的 V4 究竟是在等一個「一力降十會」的壓軸時刻,還是在攻克某種未知的技術(shù)天花板?在大廠與小龍的混戰(zhàn)中,誰能率先把「模型能力」真正轉(zhuǎn)化為「商業(yè)護城河」?

但有一點是肯定的:2026 年,單純靠「會聊天」已經(jīng)拿不到門票了。煙花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。

春節(jié).jpg

DeepSeek千問元寶智譜MiniMax

來源:雷科技

本文圖片來自:123RF 正版圖庫     

       原文標題 : DeepSeek出招!AI小龍們重排座次,紅包大戰(zhàn)只是表象?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號