123,123,123

DeepSeek出招！AI小龍們重排座次，紅包大戰(zhàn)只是表象？

2026-02-13 10:38

紅包在前，模型在后。

2026新春(2).jpg

2026 年的馬年春節(jié)，AI 的火藥味甚至蓋過了紅包味。

字節(jié)、阿里、騰訊幾乎同時把 AI 大規(guī)模推向臺前：紅包、免單、春晚互動、本地生活接入……都在爭入口。與此同時，BAT 三家也在基礎(chǔ)模型上連續(xù)出牌，視頻生成(Seedance 2.0)、圖像（Qwen-IMAGE-2.0)、多模態(tài)、語音模型密集更新，幾乎沒有空檔。

不過，基礎(chǔ)模型的對抗也從字節(jié)、阿里、騰訊等巨頭迅速蔓延到了 DeepSeek 和「AI 小龍」們。

2 月 11 日晚，DeepSeek 新模型版本全面上線，繼續(xù)把長上下文與復雜任務能力往前推；幾乎同一時間，智譜推出新一代旗艦 GLM-5，強調(diào) Agent 與編程能力；MiniMax 也帶來了 MiniMax M2.5，延續(xù)多模態(tài)與應用導向路線。

三家?guī)缀踉谕粫r間點出手，讓這場春節(jié) AI 大戰(zhàn)的「模型交鋒」又升級了一個檔位。

巨頭雙線推進，既搶入口也搶模型；創(chuàng)業(yè)公司聚焦底層能力，把籌碼壓在基礎(chǔ)模型上。真正決定 2026 年甚至未來幾年的競爭，正在這里展開。

春節(jié) AI 大戰(zhàn)：前線發(fā)紅包，后端拼模型

2 月 12 日，阿里千問宣布「春節(jié) 30 億大免單」上線 6 天完成 1.2 億筆 AI 下單，用戶說了 41 億次。稍早前，騰訊元寶則宣布春節(jié)活動啟動 5 天，元寶 AI 生圖功能日均調(diào)用增長 30 倍，時長增長超 80%。

拼圖_美圖設計室 (4).jpg

圖片來源：千問、元寶

如果說今年春節(jié) AI 大戰(zhàn)前半段是純粹的入口之爭，后半段則是更為復雜，從巨頭到初創(chuàng)大模型公司，都在集中發(fā)力基礎(chǔ)模型的迭代。

這一點其實雷科技在之前的報道《一切為了Agent：千問、階躍、Gemini打響「3.5模型大戰(zhàn)」，春節(jié)將成關(guān)鍵節(jié)點？》就有提到，包括：

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6；

- 國內(nèi)已經(jīng)發(fā)布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0；

- 剛剛發(fā)布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新；

- 還有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。

DeepSeek V4大招還沒發(fā)，把「長上下文」做深是亮點

考慮到 DeepSeek 并沒有發(fā)布官方博文，這一次更新的 DeepSeek 新模型大概率不是 V4，而是 V3.2 系列的更新（或為 V3.5）。

不過這也可以看作 V4 發(fā)布前的「灰度版」，因為按照 The Information 的最新爆料，DeepSeek V4 內(nèi)部初步測試顯示，其在模型的編程能力了已經(jīng)超越了 Claude（沒有指出具體模型）。

而從網(wǎng)友們統(tǒng)一收到的 DeepSeek 回復來看，DeepSeek 新模型的變化集中在兩點：百萬級長上下文和知識庫更新。

拼圖_美圖設計室.jpg

首先是上下文窗口從之前的 128K 直接拉升到了 1M（100 萬 Token），你可以一次性把《三體》全集或者一整個項目的代碼倉庫塞給它。測試顯示，它處理這類長文檔的響應速度非�？欤辉傩枰謩硬鸱治募�。

另外，DeepSeek 新模型的知識庫也更新到了 2025 年 5 月，但依然不支持多模態(tài)——無法理解圖片（文字內(nèi)容除外）和視頻，也符合 DeepSeek 一直堅持的「語言模型」路線：

不追求炫目的多模態(tài)，而是把文本推理、工程任務這些高頻剛需做到極致。

而上下文長度的大幅提升，不僅長文檔處理與多輪推理能力更穩(wěn)定，理論上也會改善長代碼理解、多步驟分析等復雜場景執(zhí)行表現(xiàn)。

時隔 1 個多月迭代，智譜 GLM-5 把 Agent 推到臺前

截屏2026-02-12 17.27.59.png

相比之下，GLM-5 作為原生 Agent 基座模型的升級更具「代際感」。雖然距離去年底發(fā)布 GLM-4.7 僅僅過去 1 個多月，但智譜年初上市時候預告的新一代模型，確實升級不小。

這一代模型的核心關(guān)鍵詞不再是對話，而是 Agent 與編程能力，也規(guī)格已經(jīng)明顯向「Agent 基礎(chǔ)模型」靠攏：上下文達到 200K 級別，最大輸出可達 128K，模型規(guī)模進一步擴大，訓練體系也做了重構(gòu)。

但真正的變化還是發(fā)生在能力結(jié)構(gòu)上。

GLM-5.0 被直接設計為可執(zhí)行任務的 Agent 模型，強調(diào)編程能力、工具調(diào)用與長流程執(zhí)行。在編程測試中，它已經(jīng)能處理項目級代碼與調(diào)試問題，模型可以拆解需求、調(diào)用接口、持續(xù)執(zhí)行任務，并在多階段過程中保持目標一致。

繼續(xù)押注多模態(tài)，MiniMax M2.5依然堅持生產(chǎn)至上

MiniMax 從模型到應用的垂直路線，依舊與前兩者拉開距離。

MiniMax M2.5 的升級重點仍然放在多模態(tài)與內(nèi)容生成能力，但強調(diào)的一整套多模態(tài)能力的推進，包括語音生成、音樂生成與文本能力同步提升，強調(diào)可直接進入創(chuàng)作與產(chǎn)品流程。

模型繼續(xù)采用 MoE 架構(gòu)，在保持規(guī)模的同時控制推理成本，更適合部署在應用側(cè)。語音克隆、情緒表達、音樂生成質(zhì)量的提升，使它更接近「生產(chǎn)工具」，而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比誰最聰明，而是更偏向讓模型在內(nèi)容生產(chǎn)環(huán)節(jié)真正可用，生成內(nèi)容、參與創(chuàng)作、進入產(chǎn)品流程。

這條路徑也決定了 MiniMax 的目標不是 benchmark，而是可落地的生產(chǎn)能力。

三家模型的路徑差異由此變得非常具體：DeepSeek 把長推理能力做到極致，智譜把模型推向 Agent 工程形態(tài)，MiniMax 則把多模態(tài)生產(chǎn)能力做成基礎(chǔ)設施。它們不再圍繞同一套指標競爭，而是在不同能力方向上構(gòu)建各自的模型形態(tài)。

但共性同樣明顯。參數(shù)規(guī)模不再是核心賣點，聊天體驗也不再是主要目標，所有升級都在指向一件事——模型要能參與真實任務，而不僅是給出答案。

DeepSeek 炸場一年后，「AI 小龍」位次已劇變

把時間撥回到去年春節(jié)，DeepSeek-V3 和 R1 的開源發(fā)布，沖擊了全球 AI 格局，也成為「AI 小龍」陣營的分水嶺。

關(guān)鍵不只是「模型很強」，更在于成本被重新定義。低成本、高性能的推理模型開始出現(xiàn)后，行業(yè)對基礎(chǔ)模型的預期突然變了——不只是要求嚴格訓練出一個模型，而是要求更低成本的更強模型。

劇烈的模型競爭加速，再加之訓練算力的匱乏，直接引發(fā)了「AI 小龍」陣營的明顯分化。百川和零一幾乎已經(jīng)退出「前沿基礎(chǔ)模型」的主戰(zhàn)場：前者轉(zhuǎn)向醫(yī)療等垂直方向，后者更多走企業(yè)與行業(yè)場景路線，更新節(jié)奏明顯放緩。

當基礎(chǔ)模型進入高投入、高密度迭代階段，只有極少數(shù)團隊還能長期承受算力與研發(fā)壓力。

不過今年的情況又有些不一樣，最直接的一點就是 DeepSeek V4 至今沒有發(fā)布。從外部看，可能有兩種解釋。

一種是技術(shù)層面的現(xiàn)實：推理能力、長上下文、工程穩(wěn)定性這些方向本身難度更高，模型要跨出一整代的差距，需要更長周期，而且之前也傳出過 DeepSeek 在訓練過程遇到難題。另一種則是更偏策略性，不只是跟著友商一起發(fā)布，而是作為壓軸登場，形成宣發(fā)上的優(yōu)勢。

還有一個更容易被忽略的變化是：今年春節(jié)，DeepSeek 要面對字節(jié)、阿里、騰訊在模型上的高強度投入，以及全球模型的快速迭代，最直觀的例子就是最近引爆全球的字節(jié) Seedance 5.0 視頻模型。