訂閱
糾錯(cuò)
加入自媒體

豆包、千問與Kimi,站在AI Agent的岔路口

撰文 | 郝   鑫

編輯 | 吳先之

“真正決定企業(yè)未來的轉(zhuǎn)折點(diǎn),正在發(fā)生,不是遠(yuǎn)方的AGI,而是當(dāng)下的智能體。”

這是谷歌在開年給出的最強(qiáng)預(yù)測,2026年將是AI Agent的爆發(fā)之年。

一個(gè)重要的趨勢是,AI正在從回答問題,走向理解目標(biāo)、制定計(jì)劃,并跨系統(tǒng)采取行動(dòng)。這意味著,未來Agent將不僅僅是對(duì)話型AI,而是能夠完成復(fù)雜任務(wù)和交付的生產(chǎn)力工具。

在中國,AI Agent發(fā)展大致可以分為兩個(gè)階段,前一階段重對(duì)話、搜索,各類AI助手類應(yīng)用層出不窮,并未分得出高下。從用戶量上看,幾個(gè)熟面孔包括巨頭公司的代表有抖音豆包、騰訊元寶和阿里千問,創(chuàng)業(yè)公司的代表有DeepSeek和Kimi等。這一階段的本質(zhì)是流量入口和用戶習(xí)慣的爭奪。

時(shí)間來到2025年末和今年初,進(jìn)入第二階段后,AI Agent發(fā)展呈現(xiàn)出明顯分化。各家依據(jù)自身的戰(zhàn)略和資源,瞄定了不同價(jià)值方向。

豆包深化在語音對(duì)話、圖片與視頻生成領(lǐng)域的娛樂化應(yīng)用;千問依托阿里系生態(tài)優(yōu)勢,聚焦生活服務(wù),扮演“行政管家”角色;Kimi則將重心放在生產(chǎn)力方向,通過自研Agent模型推動(dòng)AI與工作流的深度融合。

回到谷歌開頭的論斷,從豆包、千問和Kimi身上已經(jīng)初見端倪。差異化競爭的背后,是逐漸達(dá)成的共識(shí),AI Agent的價(jià)值,最終必須由解決實(shí)際問題的能力來定義。

輸入決定交付

探究是什么原因造成了豆包、千問與Kimi們的不同選擇,或許要回到一個(gè)簡單的原理,即輸入決定輸出的質(zhì)量。

這一法則,在AI Agent時(shí)代被賦予了新的涵義,Agent所依賴的輸出,已經(jīng)不僅僅是用戶的簡單指令,更包括了其對(duì)任務(wù)上下文的深度理解、對(duì)可用工具的精確調(diào)用以及對(duì)多步驟流程的可靠規(guī)劃。

從輸入與輸出的角度看,豆包的輸入場景根植于字節(jié)的娛樂與內(nèi)容生態(tài)。它的輸入是開放、多模態(tài)的創(chuàng)意靈感。用戶可以提供一段文字、一張圖片、一句語音,甚至只是一個(gè)模糊的想法。這種輸入的不確定性和娛樂導(dǎo)向,要求模型具備強(qiáng)大的聯(lián)想能力和內(nèi)容生成能力。

豆包更傾向于將任務(wù)邊界限定在創(chuàng)意內(nèi)容生成領(lǐng)域,不追求解決一個(gè)確切的問題,而是激發(fā)創(chuàng)意的過程,其核心指標(biāo)是內(nèi)容的新穎性、趣味性和傳播度。

交付的結(jié)果往往是一個(gè)短視頻腳本、一張趣味圖片或一段配音,價(jià)值在于激發(fā)用戶的二次創(chuàng)作和社交分享。在抖音火起來的“模擬站姐生圖”“我想要占據(jù)你絲滑轉(zhuǎn)場”等均出自于豆包,這相當(dāng)于完成了從AI生成到用戶交互的接力。

千問打造的是以服務(wù)調(diào)度為中心的輸入、輸出模式。千問背靠阿里覆蓋衣食住行的成熟生態(tài),輸入的是結(jié)構(gòu)化的生活服務(wù)需求。用戶通常提出“訂一張飛往上海的機(jī)票”或“買一杯奶茶”這類明確的指令。在輸入中天然包含了時(shí)間、地點(diǎn)、商品、服務(wù)等因素。

千問的輸入帶有明顯的指向性,Agent任務(wù)邊界被劃定在阿里生態(tài)可觸及的服務(wù)當(dāng)中。它的核心是將自然語言指令,轉(zhuǎn)化為準(zhǔn)確的API調(diào)用,衡量成功的指標(biāo)是服務(wù)的完成率、效率和用戶體驗(yàn)度。

所想即所得,千問最終交付的是已完成的服務(wù)結(jié)果,例如一張出票的訂單、一份外賣、一條行程規(guī)劃。千問將阿里系的流量聚到一處,其價(jià)值在于替代傳統(tǒng)的APP交互,成為服務(wù)生態(tài)的統(tǒng)一智能入口,未來所能觸及的邊界,取決于連接生態(tài)的深度和與外界的互動(dòng)。

Kimi的方向代表了創(chuàng)業(yè)公司的一種取舍,不做生活?yuàn)蕵、不做多模態(tài)生成。Agent更專注于深入研究、數(shù)據(jù)分析、PPT、網(wǎng)站開發(fā)等偏生產(chǎn)力與復(fù)雜任務(wù)的功能,這些往往需要長程規(guī)劃、復(fù)雜工具調(diào)用,具備高經(jīng)濟(jì)價(jià)值潛力。

按照上面的邏輯,Kimi Agent輸入是復(fù)雜的專業(yè)工作流。用戶多數(shù)提交數(shù)十萬字的行業(yè)文檔、一個(gè)多步驟的項(xiàng)目需求或一套需要分析的數(shù)據(jù)集。該類型的輸入具有超長上下文、高信息密度和強(qiáng)邏輯性的特點(diǎn)。

當(dāng)Kimi將任務(wù)邊界拓展至,需要深度規(guī)劃、多工具調(diào)用和長鏈條推理的工作流時(shí),其衡量的成功標(biāo)準(zhǔn)就變成了任務(wù)的完整交付、專業(yè)度與效率的提升。結(jié)果是,Kimi交付的是直接可用的工作成果,如一份結(jié)構(gòu)完整的行業(yè)報(bào)告、一套數(shù)據(jù)分析圖表等。

和OpenAI的Deep Research思路類似,核心價(jià)值在于能夠直接替代部分重復(fù)性、低創(chuàng)造性的專業(yè)勞動(dòng)。

Agent的生產(chǎn)力向

不久前,豆包因?yàn)榘l(fā)行搭載AI助手版的手機(jī)引發(fā)熱議,千問也在進(jìn)一步打通淘系生態(tài)后刷屏。因此,這里我們想更多聊一下創(chuàng)業(yè)公司代表的Kimi。

當(dāng)昔日并稱為“AI六小虎”的智譜、MimiMax相繼在港股上市后,外界把疑問拋到了Kimi面前,就差問一句“and you”?

在Kimi創(chuàng)始人楊植麟所發(fā)布的內(nèi)部信中,他回應(yīng)稱,已完成約合35億元的C輪融資,當(dāng)前現(xiàn)金持有量超過100億元,短期不著急上市,K3模型進(jìn)一步Scaling,產(chǎn)品和商業(yè)化上聚焦Agent。

回顧去年一年,在Kimi年初轉(zhuǎn)向基礎(chǔ)模型和Agent研究后,低調(diào)的同時(shí)也收獲了更多成果。

2025年Kimi以“Token效率(Token Efficiency)+長上下文(Long Context)”為核心技術(shù)路徑,打造具備主動(dòng)規(guī)劃與復(fù)雜任務(wù)執(zhí)行能力的Agent,并通過算法與架構(gòu)創(chuàng)新突破現(xiàn)有智能上限。

Token Efficiency和Long Context是Kimi兩個(gè)關(guān)鍵技術(shù)路線方向。為了提升訓(xùn)練效率,Kimi首次在超大規(guī)模模型的預(yù)訓(xùn)練中驗(yàn)證了二階優(yōu)化器Muon的價(jià)值,相比行業(yè)已經(jīng)用了十多年的傳統(tǒng)Adam優(yōu)化器實(shí)現(xiàn)約2倍的Token效率提升,相當(dāng)于用同等資源訓(xùn)練出更高智能水平的模型。

行業(yè)專家稱,“現(xiàn)在還能在optimizer這樣fundamental的領(lǐng)域,有這么大的進(jìn)展,真是讓人吃驚”。作為模型架構(gòu)層2025年最大的進(jìn)展之一,Muon優(yōu)化器后續(xù)已經(jīng)被包括智譜GLM和DeepSeek Engram在內(nèi)的中國開源模型陸續(xù)采用,充分展現(xiàn)了中國開源生態(tài)的力量。

拓展上下文能力方面,Kimi提出基于線性注意力改進(jìn)的“Kimi Linear”架構(gòu)。首次在長上下文任務(wù)上性能超越全注意力Transformer,并在百萬級(jí)上下文長度下實(shí)現(xiàn)6–10倍的端到端速度提升,同時(shí)保持更強(qiáng)的記憶與表達(dá)能力。

楊植麟提到,Kimi的K2模型是“中國第一個(gè)Agent模型”。

通過K2 Thinking的升級(jí),Kimi能夠完成復(fù)雜的工具調(diào)用并幫助解決高難度問題。Kimi K2在實(shí)戰(zhàn)中可以執(zhí)行兩百多個(gè)步驟的復(fù)雜任務(wù),已經(jīng)能夠幫助用戶完成一系列高難度工作,展現(xiàn)出與全球頭部Agent模型競爭的能力。

Kimi的深度研究功能更適合專業(yè)用戶使用,不需要有前情提要,直接列出研究要求和可視化需求即可。Kimi能夠快速get到用戶想要的東西,并進(jìn)一步地確認(rèn)、明晰要點(diǎn),盡管這有一點(diǎn)晦澀。緊接著Kimi會(huì)自行調(diào)取瀏覽器工具,邊搜索邊分析、確認(rèn),待結(jié)束后生成一份詳細(xì)的研究報(bào)告和排版好的可視化網(wǎng)頁。

基于深度研究、PPT和通用Agent模式(OK Computer)中的數(shù)據(jù)分析等能力,Kimi開啟了Agent能力的商業(yè)化,以訂閱制為主,不同等級(jí)的會(huì)員可以使用不同次數(shù)的Agent能力。據(jù)Kimi全員信稱,全球付費(fèi)用戶數(shù)月增速170%,這在國內(nèi)普遍免費(fèi)的大背景下,邁出了艱難的第一步。

在剛剛知名風(fēng)投機(jī)構(gòu)a16z聯(lián)合創(chuàng)始人Marc Andreessen開年演講中,特別提到來自中國的Kimi模型是領(lǐng)先的開源模型之一。從基準(zhǔn)測試來看,已基本復(fù)現(xiàn)了GPT-5的推理能力,除了全球范圍內(nèi)“超新星”的DeepSeek外,Qwen、字節(jié)、Kimi等也具有強(qiáng)大的競爭力。這里面,Kimi是唯一一家創(chuàng)業(yè)公司。

智能的價(jià)值

從豆包到Kimi,三位玩家AI Agent路徑的選擇,不僅僅是產(chǎn)品功能的差異,更是對(duì)什么是Agent核心價(jià)值,這一問題的回答。

不同的理解,決定了他們未來的競爭維度。

豆包定義了如何用Agent處理非結(jié)構(gòu)化創(chuàng)意輸入,交付情緒與互動(dòng)價(jià)值。倒推對(duì)模型的要求,需要具備強(qiáng)大的多模態(tài)生成與風(fēng)格模仿能力。生態(tài)決定了護(hù)城河在哪里,豆包生態(tài)是內(nèi)容創(chuàng)作與分發(fā)的流量網(wǎng)絡(luò),其壁壘在于能否持續(xù)產(chǎn)出爆款內(nèi)容并激發(fā)UGC。

千問定義了如何用Agent理解結(jié)構(gòu)化商業(yè)意圖,交付交易與效率價(jià)值,這要求其模型得具備極高的意圖識(shí)別準(zhǔn)確率與API調(diào)用可靠性。千問依賴于阿里的商業(yè)操作系統(tǒng),其壁壘在于對(duì)支付、物流、本地生活等服務(wù)的無縫整合深度。

Kimi Agent正試圖定義如何用Agent駕馭復(fù)雜專業(yè)任務(wù),交付生產(chǎn)力與解決方案價(jià)值。這需要模型擁有深度的邏輯推理、任務(wù)規(guī)劃與長程記憶能力。Kimi通過構(gòu)建專業(yè)場景下“模型+工具+工作流”標(biāo)準(zhǔn),正在加強(qiáng)對(duì)于垂直行業(yè)復(fù)雜需求的理解與滿足能力,吸引的是付費(fèi)意愿強(qiáng)的專業(yè)用戶和組織。

但歸結(jié)到一點(diǎn),豆包、千問、Kimi以及更多的公司,都在定義和量化不同形態(tài)的智能價(jià)值,并將其產(chǎn)品化。

新的階段,AI Agent讓智能的價(jià)值,進(jìn)一步得到放大。

第一步是價(jià)值的Token化,各家將模糊的智能能力拆解為可標(biāo)準(zhǔn)計(jì)量的最小單元。這如同曾經(jīng)為電力配置了千瓦時(shí)的單位,使智能的消耗和計(jì)價(jià)成為了可能,為商業(yè)化奠定了基礎(chǔ)。

接下來是價(jià)值的流通化,當(dāng)智能的價(jià)值被量化后,便能在生態(tài)中自由組合與流通,Agent就成為了智能價(jià)值的交易接口。典型如千問,流通的是交易意圖和服務(wù),Token的價(jià)值在電商、本地生活等多個(gè)場景中流轉(zhuǎn)倍增。

最后是價(jià)值重組,也是谷歌提到的從工具層到工作與組織層的深化。

如果高性價(jià)比的智能也能像水電般隨取隨用,企業(yè)的底層邏輯有可能被改寫。公司無需招聘專家團(tuán)隊(duì),只需通過接入專業(yè)垂類Agent,就能獲得該領(lǐng)域的頂級(jí)能力,從而突破原有的能力壁壘。創(chuàng)新也許不僅限于內(nèi)部生發(fā),也可來自于對(duì)外部智能服務(wù)的創(chuàng)造性組合。

正如a16z聯(lián)合創(chuàng)始人所言,我們正目睹一種“超通縮”的智能單位成本,與一種“超通脹”的智能應(yīng)用需求歷史性地相遇。

AI Agent,恰好是創(chuàng)造智能化價(jià)值,同時(shí)影響價(jià)值流向的關(guān)鍵。

       原文標(biāo)題 : 豆包、千問與Kimi,站在AI Agent的岔路口

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)