123,123,123

接替Manus，字節(jié)的Agent王牌能打多久？

2025-04-24 09:27

文｜魏琳華

編｜王一粟

在DeepSeek和Manus的沖擊之下，“沉寂”已久的字節(jié)，做出了首個(gè)由大廠發(fā)布的Agent爆款。

從4月18號(hào)扣子Agent上線以來(lái)，各個(gè)AI交流群都開(kāi)始搶起了扣子的邀請(qǐng)碼。用戶們蹲在各個(gè)群里等待5個(gè)一組的邀請(qǐng)碼放出，又在幾秒鐘被橫掃一空。

與之對(duì)應(yīng)的是，即便算力充沛如字節(jié)，也沒(méi)頂住用戶對(duì)Agent嘗鮮的熱情。幾天內(nèi)，扣子出現(xiàn)過(guò)幾次因人多而服務(wù)器爆滿的情況，可見(jiàn)，其算力消耗也遠(yuǎn)遠(yuǎn)超過(guò)了字節(jié)原本的預(yù)期。

在Manus之后，字節(jié)新上線的Agent，靠著優(yōu)化的產(chǎn)品思路和量大便宜的優(yōu)勢(shì)，暫時(shí)成功吃下了昂貴的Manus遺留的空白市場(chǎng)。

一時(shí)的熱鬧后，扣子空間會(huì)曇花一現(xiàn)，還是成為字節(jié)屹立不倒的招牌？

邀請(qǐng)碼被瘋搶，扣子補(bǔ)上了Agent市場(chǎng)的空白

在扣子本次更新的多款產(chǎn)品和功能中，“扣子空間”成為了引爆用戶熱情的關(guān)鍵產(chǎn)品。

“扣子空間”，是字節(jié)的智能體平臺(tái)扣子推出的Agent，目前已經(jīng)滿足了規(guī)劃、使用工具和記憶等關(guān)鍵的自主能力。

根據(jù)扣子官網(wǎng)給出的各種使用體驗(yàn)案例，扣子既可以用來(lái)寫(xiě)游戲攻略、市場(chǎng)調(diào)研報(bào)告，也能基于字節(jié)提供的數(shù)十種MCP實(shí)現(xiàn)更加復(fù)雜的需求，比如用高德地圖MCP+Agent寫(xiě)一份旅游指南，用飛書(shū)多維表格統(tǒng)計(jì)數(shù)據(jù)等等。

實(shí)際體驗(yàn)下來(lái)，扣子的Agent更接近于OpenAI發(fā)布的智能體DeepResearch和Manus的結(jié)合體。

拿到體驗(yàn)碼后，光錐智能以“字節(jié)一年To B的AI戰(zhàn)略”為要求，讓Agent幫忙收集信息并生成一份分析報(bào)告。Agent將任務(wù)拆解成4個(gè)步驟，并在測(cè)試者的意見(jiàn)修改下，給出最終的拆解結(jié)果：

通過(guò)在瀏覽器搜索信息，扣子Agent用了十幾分鐘，把上述三個(gè)步驟收集到的信息各整理成文件留存，供使用者隨時(shí)查看。最后，Agent調(diào)用了網(wǎng)頁(yè)生成工具，輸出了一份長(zhǎng)達(dá)10個(gè)小節(jié)的報(bào)告。雖然概況的內(nèi)容還較為簡(jiǎn)略，但Agent的調(diào)查報(bào)告已經(jīng)能做到基本覆蓋各個(gè)維度的信息。

于產(chǎn)品設(shè)計(jì)思路上，字節(jié)整體的設(shè)計(jì)方式更加接近DeepResearch。比如兩者都將Agent的思考過(guò)程和收集內(nèi)容放到了整體界面的右側(cè)，讓使用者能夠更加清晰地看到AI的每一步操作。

在此基礎(chǔ)上，扣子的Agent還延續(xù)了字節(jié)一貫突出的產(chǎn)品設(shè)計(jì)思路，進(jìn)一步提升了用戶的交互體驗(yàn)。

當(dāng)前，一般的Agent雖然生成速度快，但往往難以滿足用戶的復(fù)雜需求；深度思考的Agent又往往效率不如前者，需要花幾十分鐘才能給出結(jié)果。

考慮到用戶對(duì)于生成效率和質(zhì)量?jī)煞N不同的需求，扣子的智能體史無(wú)前例地在Agent使用界面中開(kāi)啟了兩種模式——“探索模式”和“規(guī)劃模式”。

對(duì)比起來(lái)，前者的思考速度快，但只能處理需求較為簡(jiǎn)單的任務(wù)，而后者則能根據(jù)用戶需求將任務(wù)拆分成詳細(xì)步驟，還能在生成規(guī)劃后讓用戶根據(jù)需求修改。加入用戶的修改意見(jiàn)后，也能提升AI操作的準(zhǔn)確性。

不過(guò)，如果以智能體目前的三個(gè)關(guān)鍵能力指標(biāo)，即規(guī)劃、工具調(diào)用和記憶來(lái)衡量，字節(jié)的Agent表現(xiàn)還無(wú)法比肩DeepResearch和Manus。

在工具調(diào)用上，目前字節(jié)平臺(tái)給出的可直接調(diào)用的MCP只有十多種，還需要進(jìn)一步擴(kuò)充。

交給扣子Agent生成內(nèi)容的體驗(yàn)中，目前它搜索的文字內(nèi)容也多直接來(lái)自互聯(lián)網(wǎng)引擎搜索，沒(méi)辦法像DeepResearch一樣直接在特定的垂類網(wǎng)站搜索信息，也沒(méi)有橫跨各個(gè)平臺(tái)的內(nèi)容搜索。內(nèi)容池窄了，生成的內(nèi)容質(zhì)量自然有限。

而在記憶問(wèn)題上，也有不少體驗(yàn)扣子的用戶表示，在測(cè)試了十幾輪上下文對(duì)話后，Agent就會(huì)出現(xiàn)“失憶”的情況，無(wú)法記住之前的交流內(nèi)容。

實(shí)際上，這也是由于扣子Agent的底層模型決定。

當(dāng)下的共識(shí)是，Agent的能力依賴于底層模型的水平。但和用自研模型的OpenAI，以及調(diào)用Claude 3.7等模型的Manus相比，扣子的底層模型主要使用的是豆包通用模型Doubao-1.5-pro，從效果和部分開(kāi)發(fā)者反饋效果來(lái)看，無(wú)論在文本理解思考能力還是代碼輸出等能力上，扣子Agent表現(xiàn)還稍遜于前者。

不過(guò)，為了提升Agent使用體驗(yàn)，字節(jié)在多模態(tài)能力上下了功夫。比如字節(jié)在上一周發(fā)布了專門為Agent設(shè)計(jì)的GUI（圖形交互界面）模型，這也讓扣子Agent在視覺(jué)理解和圖片生成能力上表現(xiàn)更加突出。

在上述光錐智能實(shí)際體驗(yàn)后，扣子Agent按照要求生成的報(bào)告不僅詳細(xì)分好了對(duì)應(yīng)的報(bào)告節(jié)點(diǎn)，且在UI設(shè)計(jì)上體驗(yàn)拉滿，給到了圖文并茂的調(diào)研報(bào)告。

雖然，扣子的Agent目前表現(xiàn)還沒(méi)辦法追趕上Manus，但在一片基本空白的自主Agent市場(chǎng)中，扣子Agent的表現(xiàn)已經(jīng)足夠驚艷。它做到了火山引擎最愛(ài)強(qiáng)調(diào)的那句“成本低、易落地”，先把具備自主執(zhí)行能力的Agent端上來(lái)，讓人們能夠體驗(yàn)并反饋。

如同字節(jié)給扣子空間的定位“一個(gè)通用的實(shí)習(xí)生配合各領(lǐng)域的專家”，現(xiàn)階段的扣子Agent，做到了這個(gè)執(zhí)行標(biāo)準(zhǔn)。

搶占時(shí)間窗口，扣子拿下大廠智能體首勝

“扣子空間”的誕生，是大廠在智能體路線上的一次“糾偏”。

為什么Manus沒(méi)有出生在大廠？這個(gè)在Manus爆火后常常被人提起的問(wèn)題，要從大廠做智能體的思路說(shuō)起。

從OpenAI發(fā)布GPTs商店開(kāi)始，大廠在2024年上半年紛紛跟進(jìn)智能體。字節(jié)跳動(dòng)的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺(tái)百煉，都是在這個(gè)時(shí)間段先后發(fā)布。

字節(jié)海外版平臺(tái)Coze

但大廠們對(duì)這些智能體的定位，仍然停留在做開(kāi)發(fā)者生態(tài)的平臺(tái)上——智能體商店。

通過(guò)接入市面上多種大模型能力和各種Agent開(kāi)放工具，智能體平臺(tái)們不斷吸納開(kāi)發(fā)者，寄希望于靠開(kāi)發(fā)者們做出應(yīng)用生態(tài)，再借著各種功能的智能體來(lái)吸引用戶，智能體平臺(tái)則順勢(shì)成為流量生態(tài)的入口。

之所以做出這樣的選擇，是大廠一貫的“平臺(tái)思維”的慣性——做好平臺(tái)和基礎(chǔ)工具，并不親自下場(chǎng)。這就像淘寶和京東一開(kāi)始的區(qū)別。

另外一方面也是由于模型能力的制約。彼時(shí)，在多模態(tài)能力尚未完善的情況下，大模型還無(wú)法“理解”手機(jī)和電腦的操作界面信息，也就無(wú)法完成各種自主操作。

所以，扣子們重點(diǎn)做的是通用工具的打磨，完善各種工作流，降低開(kāi)發(fā)者們的開(kāi)發(fā)門檻。再采用流量分成的方式，吸引開(kāi)發(fā)者接入。

但在去年11月，智譜發(fā)布的Agent“AutoGLM”開(kāi)始能夠?qū)崿F(xiàn)點(diǎn)外賣、發(fā)紅包等自主操作后，大廠們肯定看到了相關(guān)的潛力，但從行動(dòng)上來(lái)看，大廠的速度顯然沒(méi)有Manus更快，產(chǎn)品也沒(méi)有Manus深。

在現(xiàn)象級(jí)爆款產(chǎn)品面前，各家大廠都開(kāi)始坐不住了。向來(lái)求穩(wěn)，發(fā)產(chǎn)品從來(lái)不發(fā)“半成品”的字節(jié)，這次搶著把還不夠完善的扣子Agent發(fā)了出來(lái)。

如今的扣子Agent，就是一個(gè)滿足“60分及格”的產(chǎn)品，它要做的就是搶占時(shí)間窗口。

此前，譚待曾在采訪中表示，做B端，搶先發(fā)優(yōu)勢(shì)的前提是產(chǎn)品或服務(wù)要達(dá)到及格線。

“做B端更要為結(jié)果負(fù)責(zé)�！弊T待說(shuō)，“如果你的產(chǎn)品足夠‘可用’，搶占先發(fā)優(yōu)勢(shì)肯定是有價(jià)值的。”

這次，字節(jié)選對(duì)了。

Manus雖然在短時(shí)間內(nèi)在市場(chǎng)點(diǎn)燃了熱度，成功驗(yàn)證PMF，但它的技術(shù)護(hù)城河并不高，在強(qiáng)手云集的AI行業(yè)中，多家大廠都開(kāi)始著手準(zhǔn)備復(fù)刻Manus類產(chǎn)品。

從一開(kāi)始的爆火，Manus要想真的在行業(yè)中“長(zhǎng)青”，關(guān)鍵在于兩點(diǎn)，一是保證技術(shù)優(yōu)勢(shì)持續(xù)領(lǐng)先，二則是解決Agent成本高企的問(wèn)題，快速鋪開(kāi)市場(chǎng)規(guī)模。

但現(xiàn)在，Manus仍然深受成本問(wèn)題制約。在Manus的閉門會(huì)上，其工作人員分享Manus單次運(yùn)行成本在2美元左右。高昂的成本，注定了Manus只能在起步階段向少量用戶開(kāi)放。即使開(kāi)放商業(yè)計(jì)劃，它的定價(jià)也不會(huì)是一筆普通用戶能承擔(dān)的費(fèi)用。

開(kāi)出最低一個(gè)月39美金的會(huì)員定價(jià)的情況下，Manus還無(wú)法進(jìn)一步提升市場(chǎng)占有率。

Manus的兩個(gè)會(huì)員訂閱方案

而成本，就是大廠的優(yōu)勢(shì)，更何況是背靠火山引擎的云底座，可以把現(xiàn)有產(chǎn)品做得更便宜、好上手。

有意思的是，這次扣子Agent在營(yíng)銷上也似乎有意在參考Manus的“饑餓營(yíng)銷”。從最開(kāi)始上線就發(fā)出了大量邀請(qǐng)碼，且一個(gè)用戶使用后就能再拿到5個(gè)邀請(qǐng)碼繼續(xù)分享裂變�？梢哉f(shuō)，字節(jié)為這次扣子的上線煞費(fèi)苦心，也準(zhǔn)備了不少?gòu)椝帯?/p>

字節(jié)的后發(fā)優(yōu)勢(shì)，讓Manus類的自主智能體不再停留在Demo中，從而在市場(chǎng)中率先分得一杯羹。

不過(guò)，“扣子空間”Agent能火多久，還是一個(gè)問(wèn)題。

在一次采訪中，火山引擎總裁討論過(guò)“先發(fā)優(yōu)勢(shì)和后發(fā)優(yōu)勢(shì)”。面對(duì)“第二名是否永遠(yuǎn)是投入產(chǎn)出比最高”的問(wèn)題，譚待給出了如下回答。

“第一名有很大優(yōu)勢(shì)，但第二名應(yīng)該把跟隨優(yōu)勢(shì)發(fā)揮好，前提是第二名足夠優(yōu)秀，普通賽車手也很難反超�！�

足夠優(yōu)秀的“第二名”字節(jié)，能在接下來(lái)的迭代中保住市場(chǎng)優(yōu)勢(shì)嗎？

企業(yè)級(jí)智能體，火山引擎的野心

從去年的試水觀望，到今年紛紛接入Agent，DeepSeek和Manus讓企業(yè)們看到了Agent落地的可能性，模型能力的提升也降低了實(shí)現(xiàn)的門檻。

2025年，Agent迎來(lái)爆發(fā)之年。

但企業(yè)做Agent，最大的問(wèn)題就是卡在如何接入內(nèi)部系統(tǒng)上。

和開(kāi)發(fā)者做Agent不一樣的是，企業(yè)對(duì)數(shù)據(jù)安全的要求高，這就意味著可能需要私有化部署大模型；再?gòu)穆涞匦Ч蟻?lái)說(shuō)，企業(yè)需要Agent做到準(zhǔn)確度接近100%的級(jí)別，因?yàn)樯逃妙I(lǐng)域承擔(dān)不起錯(cuò)誤結(jié)果；最后，面對(duì)很多復(fù)雜的需求，Agent想要一一實(shí)現(xiàn)，需要技術(shù)團(tuán)隊(duì)針對(duì)具體場(chǎng)景琢磨用哪些實(shí)現(xiàn)方式完成。

但在去年整體大模型能力有限的情況下，Agent要想真正接入企業(yè)，靠的還不是當(dāng)下流行的自主Agent，而是根據(jù)業(yè)務(wù)需求編寫(xiě)工作流完成。

對(duì)于沒(méi)有AI大模型基礎(chǔ)的企業(yè)來(lái)說(shuō)，沒(méi)有專門的技術(shù)人才，想做明白Agent就是難上加難。

專注智能體B端生意的廠商們，都很清楚上述的問(wèn)題。

所以，在字節(jié)從扣子上看到了Agent潛力之后，推出的扣子專業(yè)版一是只能在公有云上調(diào)用，二是這個(gè)智能體平臺(tái)只是工具的集合體，對(duì)于想真正落地的企業(yè)來(lái)說(shuō)，空有工具又不會(huì)用，也是問(wèn)題。

一位字節(jié)跳動(dòng)旗下的智能體平臺(tái)扣子的研發(fā)人員曾對(duì)光錐智能表示，“我們?cè)谑袌?chǎng)開(kāi)拓期，會(huì)免費(fèi)給客戶接入豆包大模型，還會(huì)做一對(duì)一的調(diào)試和服務(wù)�！�

但只是這樣還不夠，字節(jié)要想進(jìn)一步收獲更多客戶，就得推出一個(gè)更聚焦企業(yè)的版本，于是就有了去年5月上線的HiAgent。

HiAgent上線，先解決了一個(gè)關(guān)鍵的問(wèn)題，就是能夠把豆包私有化部署到企業(yè)中，這才能夠上企業(yè)安全的門檻。

比起之前扣子企業(yè)版明碼標(biāo)價(jià)的包月制服務(wù)，HiAgent再準(zhǔn)備著手解決的是落地方面的問(wèn)題。比如給缺少相關(guān)技術(shù)指導(dǎo)的企業(yè)直接派人才幫忙，再比如直接針對(duì)各行業(yè)做了適配行業(yè)特點(diǎn)的上百個(gè)模版。

坦白來(lái)說(shuō)，字節(jié)搭建Agent企服的思路不稀奇，這也是多家B端行業(yè)一直沿用的方式，即全方位包攬落地，再加以人力精準(zhǔn)輔助。

不過(guò)對(duì)比同期的云廠商來(lái)說(shuō)，字節(jié)無(wú)論是在扣子平臺(tái)還是在HiAgent的服務(wù)搭建上，都做得夠快、夠全，這也是字節(jié)能搶下大量智能體市場(chǎng)訂單的原因。

字節(jié)逐漸提升Agent地位的半年時(shí)間內(nèi)，也迎合上了行業(yè)內(nèi)智能體的增長(zhǎng)。據(jù)大單網(wǎng)統(tǒng)計(jì)，下半年，下半年 AI 智能體應(yīng)用落地大幅提速，增幅達(dá) 330+%。

而在競(jìng)爭(zhēng)者云集的市場(chǎng)中，火山引擎在2024年一共吃下了32個(gè)項(xiàng)目，各廠商智能體項(xiàng)目數(shù)量上位列第一。但和位列第二的科大訊飛相比，兩者的訂單數(shù)量差距只有2個(gè)。換言之，字節(jié)在Agent企服領(lǐng)域的優(yōu)勢(shì)存在，但并不算穩(wěn)固。

不過(guò)，在一眾云廠商里，字節(jié)已經(jīng)算得上是行動(dòng)上夠快、業(yè)務(wù)布局也更廣的一個(gè)。比起第四名百度，字節(jié)比后者吃下的智能體訂單數(shù)量多了1/3。

而在當(dāng)下Agent爆發(fā)的節(jié)點(diǎn)，字節(jié)更不會(huì)懈怠。它需要一個(gè)扣子在前臺(tái)吸引開(kāi)發(fā)者，再通過(guò)推出企業(yè)端服務(wù)拉攏客戶，最終，火山引擎則奔著Agent爆發(fā)背后的可觀算力消耗而去。這次，扣子平臺(tái)引發(fā)的多次服務(wù)器崩潰，側(cè)面也印證了這次算力消耗情況，已經(jīng)超出了字節(jié)的預(yù)期。

這一次的時(shí)間窗口，字節(jié)能享有多久，就要看其他廠商接下來(lái)的行動(dòng)了。

原文標(biāo)題 : 接替Manus，字節(jié)的Agent王牌能打多久？