接替Manus,字節(jié)的Agent王牌能打多久?
文|魏琳華
編|王一粟
在DeepSeek和Manus的沖擊之下,“沉寂”已久的字節(jié),做出了首個由大廠發(fā)布的Agent爆款。
從4月18號扣子Agent上線以來,各個AI交流群都開始搶起了扣子的邀請碼。用戶們蹲在各個群里等待5個一組的邀請碼放出,又在幾秒鐘被橫掃一空。
與之對應的是,即便算力充沛如字節(jié),也沒頂住用戶對Agent嘗鮮的熱情。幾天內,扣子出現過幾次因人多而服務器爆滿的情況,可見,其算力消耗也遠遠超過了字節(jié)原本的預期。
在Manus之后,字節(jié)新上線的Agent,靠著優(yōu)化的產品思路和量大便宜的優(yōu)勢,暫時成功吃下了昂貴的Manus遺留的空白市場。
一時的熱鬧后,扣子空間會曇花一現,還是成為字節(jié)屹立不倒的招牌?
邀請碼被瘋搶,扣子補上了Agent市場的空白
在扣子本次更新的多款產品和功能中,“扣子空間”成為了引爆用戶熱情的關鍵產品。
“扣子空間”,是字節(jié)的智能體平臺扣子推出的Agent,目前已經滿足了規(guī)劃、使用工具和記憶等關鍵的自主能力。
根據扣子官網給出的各種使用體驗案例,扣子既可以用來寫游戲攻略、市場調研報告,也能基于字節(jié)提供的數十種MCP實現更加復雜的需求,比如用高德地圖MCP+Agent寫一份旅游指南,用飛書多維表格統計數據等等。
實際體驗下來,扣子的Agent更接近于OpenAI發(fā)布的智能體DeepResearch和Manus的結合體。
拿到體驗碼后,光錐智能以“字節(jié)一年To B的AI戰(zhàn)略”為要求,讓Agent幫忙收集信息并生成一份分析報告。Agent將任務拆解成4個步驟,并在測試者的意見修改下,給出最終的拆解結果:
通過在瀏覽器搜索信息,扣子Agent用了十幾分鐘,把上述三個步驟收集到的信息各整理成文件留存,供使用者隨時查看。最后,Agent調用了網頁生成工具,輸出了一份長達10個小節(jié)的報告。雖然概況的內容還較為簡略,但Agent的調查報告已經能做到基本覆蓋各個維度的信息。
于產品設計思路上,字節(jié)整體的設計方式更加接近DeepResearch。比如兩者都將Agent的思考過程和收集內容放到了整體界面的右側,讓使用者能夠更加清晰地看到AI的每一步操作。
在此基礎上,扣子的Agent還延續(xù)了字節(jié)一貫突出的產品設計思路,進一步提升了用戶的交互體驗。
當前,一般的Agent雖然生成速度快,但往往難以滿足用戶的復雜需求;深度思考的Agent又往往效率不如前者,需要花幾十分鐘才能給出結果。
考慮到用戶對于生成效率和質量兩種不同的需求,扣子的智能體史無前例地在Agent使用界面中開啟了兩種模式——“探索模式”和“規(guī)劃模式”。
對比起來,前者的思考速度快,但只能處理需求較為簡單的任務,而后者則能根據用戶需求將任務拆分成詳細步驟,還能在生成規(guī)劃后讓用戶根據需求修改。加入用戶的修改意見后,也能提升AI操作的準確性。
不過,如果以智能體目前的三個關鍵能力指標,即規(guī)劃、工具調用和記憶來衡量,字節(jié)的Agent表現還無法比肩DeepResearch和Manus。
在工具調用上,目前字節(jié)平臺給出的可直接調用的MCP只有十多種,還需要進一步擴充。
交給扣子Agent生成內容的體驗中,目前它搜索的文字內容也多直接來自互聯網引擎搜索,沒辦法像DeepResearch一樣直接在特定的垂類網站搜索信息,也沒有橫跨各個平臺的內容搜索。內容池窄了,生成的內容質量自然有限。
而在記憶問題上,也有不少體驗扣子的用戶表示,在測試了十幾輪上下文對話后,Agent就會出現“失憶”的情況,無法記住之前的交流內容。
實際上,這也是由于扣子Agent的底層模型決定。
當下的共識是,Agent的能力依賴于底層模型的水平。但和用自研模型的OpenAI,以及調用Claude 3.7等模型的Manus相比,扣子的底層模型主要使用的是豆包通用模型Doubao-1.5-pro,從效果和部分開發(fā)者反饋效果來看,無論在文本理解思考能力還是代碼輸出等能力上,扣子Agent表現還稍遜于前者。
不過,為了提升Agent使用體驗,字節(jié)在多模態(tài)能力上下了功夫。比如字節(jié)在上一周發(fā)布了專門為Agent設計的GUI(圖形交互界面)模型,這也讓扣子Agent在視覺理解和圖片生成能力上表現更加突出。
在上述光錐智能實際體驗后,扣子Agent按照要求生成的報告不僅詳細分好了對應的報告節(jié)點,且在UI設計上體驗拉滿,給到了圖文并茂的調研報告。
雖然,扣子的Agent目前表現還沒辦法追趕上Manus,但在一片基本空白的自主Agent市場中,扣子Agent的表現已經足夠驚艷。它做到了火山引擎最愛強調的那句“成本低、易落地”,先把具備自主執(zhí)行能力的Agent端上來,讓人們能夠體驗并反饋。
如同字節(jié)給扣子空間的定位“一個通用的實習生配合各領域的專家”,現階段的扣子Agent,做到了這個執(zhí)行標準。
搶占時間窗口,扣子拿下大廠智能體首勝
“扣子空間”的誕生,是大廠在智能體路線上的一次“糾偏”。
為什么Manus沒有出生在大廠?這個在Manus爆火后常常被人提起的問題,要從大廠做智能體的思路說起。
從OpenAI發(fā)布GPTs商店開始,大廠在2024年上半年紛紛跟進智能體。字節(jié)跳動的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺百煉,都是在這個時間段先后發(fā)布。
字節(jié)海外版平臺Coze
但大廠們對這些智能體的定位,仍然停留在做開發(fā)者生態(tài)的平臺上——智能體商店。
通過接入市面上多種大模型能力和各種Agent開放工具,智能體平臺們不斷吸納開發(fā)者,寄希望于靠開發(fā)者們做出應用生態(tài),再借著各種功能的智能體來吸引用戶,智能體平臺則順勢成為流量生態(tài)的入口。
之所以做出這樣的選擇,是大廠一貫的“平臺思維”的慣性——做好平臺和基礎工具,并不親自下場。這就像淘寶和京東一開始的區(qū)別。
另外一方面也是由于模型能力的制約。彼時,在多模態(tài)能力尚未完善的情況下,大模型還無法“理解”手機和電腦的操作界面信息,也就無法完成各種自主操作。
所以,扣子們重點做的是通用工具的打磨,完善各種工作流,降低開發(fā)者們的開發(fā)門檻。再采用流量分成的方式,吸引開發(fā)者接入。
但在去年11月,智譜發(fā)布的Agent“AutoGLM”開始能夠實現點外賣、發(fā)紅包等自主操作后,大廠們肯定看到了相關的潛力,但從行動上來看,大廠的速度顯然沒有Manus更快,產品也沒有Manus深。
在現象級爆款產品面前,各家大廠都開始坐不住了。向來求穩(wěn),發(fā)產品從來不發(fā)“半成品”的字節(jié),這次搶著把還不夠完善的扣子Agent發(fā)了出來。
如今的扣子Agent,就是一個滿足“60分及格”的產品,它要做的就是搶占時間窗口。
此前,譚待曾在采訪中表示,做B端,搶先發(fā)優(yōu)勢的前提是產品或服務要達到及格線。
“做B端更要為結果負責!弊T待說,“如果你的產品足夠‘可用’,搶占先發(fā)優(yōu)勢肯定是有價值的。”
這次,字節(jié)選對了。
Manus雖然在短時間內在市場點燃了熱度,成功驗證PMF,但它的技術護城河并不高,在強手云集的AI行業(yè)中,多家大廠都開始著手準備復刻Manus類產品。
從一開始的爆火,Manus要想真的在行業(yè)中“長青”,關鍵在于兩點,一是保證技術優(yōu)勢持續(xù)領先,二則是解決Agent成本高企的問題,快速鋪開市場規(guī)模。
但現在,Manus仍然深受成本問題制約。在Manus的閉門會上,其工作人員分享Manus單次運行成本在2美元左右。高昂的成本,注定了Manus只能在起步階段向少量用戶開放。即使開放商業(yè)計劃,它的定價也不會是一筆普通用戶能承擔的費用。
開出最低一個月39美金的會員定價的情況下,Manus還無法進一步提升市場占有率。
Manus的兩個會員訂閱方案
而成本,就是大廠的優(yōu)勢,更何況是背靠火山引擎的云底座,可以把現有產品做得更便宜、好上手。
有意思的是,這次扣子Agent在營銷上也似乎有意在參考Manus的“饑餓營銷”。從最開始上線就發(fā)出了大量邀請碼,且一個用戶使用后就能再拿到5個邀請碼繼續(xù)分享裂變。可以說,字節(jié)為這次扣子的上線煞費苦心,也準備了不少彈藥。
字節(jié)的后發(fā)優(yōu)勢,讓Manus類的自主智能體不再停留在Demo中,從而在市場中率先分得一杯羹。
不過,“扣子空間”Agent能火多久,還是一個問題。
在一次采訪中,火山引擎總裁討論過“先發(fā)優(yōu)勢和后發(fā)優(yōu)勢”。面對“第二名是否永遠是投入產出比最高”的問題,譚待給出了如下回答。
“第一名有很大優(yōu)勢,但第二名應該把跟隨優(yōu)勢發(fā)揮好,前提是第二名足夠優(yōu)秀,普通賽車手也很難反超!
足夠優(yōu)秀的“第二名”字節(jié),能在接下來的迭代中保住市場優(yōu)勢嗎?
企業(yè)級智能體,火山引擎的野心
從去年的試水觀望,到今年紛紛接入Agent,DeepSeek和Manus讓企業(yè)們看到了Agent落地的可能性,模型能力的提升也降低了實現的門檻。
2025年,Agent迎來爆發(fā)之年。
但企業(yè)做Agent,最大的問題就是卡在如何接入內部系統上。
和開發(fā)者做Agent不一樣的是,企業(yè)對數據安全的要求高,這就意味著可能需要私有化部署大模型;再從落地效果上來說,企業(yè)需要Agent做到準確度接近100%的級別,因為商用領域承擔不起錯誤結果;最后,面對很多復雜的需求,Agent想要一一實現,需要技術團隊針對具體場景琢磨用哪些實現方式完成。
但在去年整體大模型能力有限的情況下,Agent要想真正接入企業(yè),靠的還不是當下流行的自主Agent,而是根據業(yè)務需求編寫工作流完成。
對于沒有AI大模型基礎的企業(yè)來說,沒有專門的技術人才,想做明白Agent就是難上加難。
專注智能體B端生意的廠商們,都很清楚上述的問題。
所以,在字節(jié)從扣子上看到了Agent潛力之后,推出的扣子專業(yè)版一是只能在公有云上調用,二是這個智能體平臺只是工具的集合體,對于想真正落地的企業(yè)來說,空有工具又不會用,也是問題。
一位字節(jié)跳動旗下的智能體平臺扣子的研發(fā)人員曾對光錐智能表示,“我們在市場開拓期,會免費給客戶接入豆包大模型,還會做一對一的調試和服務!
但只是這樣還不夠,字節(jié)要想進一步收獲更多客戶,就得推出一個更聚焦企業(yè)的版本,于是就有了去年5月上線的HiAgent。
HiAgent上線,先解決了一個關鍵的問題,就是能夠把豆包私有化部署到企業(yè)中,這才能夠上企業(yè)安全的門檻。
比起之前扣子企業(yè)版明碼標價的包月制服務,HiAgent再準備著手解決的是落地方面的問題。比如給缺少相關技術指導的企業(yè)直接派人才幫忙,再比如直接針對各行業(yè)做了適配行業(yè)特點的上百個模版。
坦白來說,字節(jié)搭建Agent企服的思路不稀奇,這也是多家B端行業(yè)一直沿用的方式,即全方位包攬落地,再加以人力精準輔助。
不過對比同期的云廠商來說,字節(jié)無論是在扣子平臺還是在HiAgent的服務搭建上,都做得夠快、夠全,這也是字節(jié)能搶下大量智能體市場訂單的原因。
字節(jié)逐漸提升Agent地位的半年時間內,也迎合上了行業(yè)內智能體的增長。據大單網統計,下半年,下半年 AI 智能體應用落地大幅提速,增幅達 330+%。
而在競爭者云集的市場中,火山引擎在2024年一共吃下了32個項目,各廠商智能體項目數量上位列第一。但和位列第二的科大訊飛相比,兩者的訂單數量差距只有2個。換言之,字節(jié)在Agent企服領域的優(yōu)勢存在,但并不算穩(wěn)固。
不過,在一眾云廠商里,字節(jié)已經算得上是行動上夠快、業(yè)務布局也更廣的一個。比起第四名百度,字節(jié)比后者吃下的智能體訂單數量多了1/3。
而在當下Agent爆發(fā)的節(jié)點,字節(jié)更不會懈怠。它需要一個扣子在前臺吸引開發(fā)者,再通過推出企業(yè)端服務拉攏客戶,最終,火山引擎則奔著Agent爆發(fā)背后的可觀算力消耗而去。這次,扣子平臺引發(fā)的多次服務器崩潰,側面也印證了這次算力消耗情況,已經超出了字節(jié)的預期。
這一次的時間窗口,字節(jié)能享有多久,就要看其他廠商接下來的行動了。
原文標題 : 接替Manus,字節(jié)的Agent王牌能打多久?

請輸入評論內容...
請輸入評論/評論長度6~500個字