訂閱
糾錯(cuò)
加入自媒體

全球頂級(jí)投行,篩選出了具身智能的終極答案

作者 | 向欣

2025 年,具身智能開始從講故事走向算賬本的新階段。

這一年,動(dòng)輒上億的訂單、密集進(jìn)場(chǎng)的融資,讓行業(yè)熱鬧得像開了鍋。但在這種熱度過載的環(huán)境中,流量的分配并不總是與實(shí)力的厚度成正比。

眼下,具身智能需要從喧囂中剝離出來,篩選出那些具備穿越行業(yè)周期能力的公司。

從頂級(jí)投行的研究視角中,篩選的結(jié)果正在變得清晰。

今年,摩根士丹利發(fā)布的兩份報(bào)告在具身智能領(lǐng)域極具影響力:

9 月的《Humanoid Horizons: Closer to the Real World》聚焦商業(yè)落地進(jìn)展,

12 月的《The Robot Almanac Vol. 1》(機(jī)器人年鑒 卷一)則系統(tǒng)性地搭建了一個(gè)面向未來數(shù)十年的機(jī)器人產(chǎn)業(yè)坐標(biāo)系,試圖回答哪些技術(shù)方向、產(chǎn)業(yè)環(huán)節(jié)和公司類型,最有可能在長(zhǎng)期競(jìng)爭(zhēng)中勝出。

在這一同時(shí)涵蓋技術(shù)與商業(yè)維度的篩選體系中,智元機(jī)器人、銀河通用、智平方等中國(guó)企業(yè)頻頻上榜。

值得注意的是,智平方是其中少數(shù)能夠同時(shí)作為機(jī)器人基礎(chǔ)大模型代表廠商與商業(yè)落地標(biāo)桿的選手。

這種稀缺性,使其成為一個(gè)值得被拆解的樣本。

具身大模型的技術(shù)搶跑

在具身智能的技術(shù)棧中,大腦(具身大模型)決定了機(jī)器人的智能上限,是這場(chǎng)智能變革中最關(guān)鍵的驅(qū)動(dòng)器。

過去一年,全球具身大模型的技術(shù)路線經(jīng)歷了從混沌到逐漸收斂的過程。

年初,大摩發(fā)布的《Humanoid 100》報(bào)告中,曾評(píng)價(jià)中國(guó)在人形機(jī)器人本體上具備顯著優(yōu)勢(shì),而美國(guó)在智能大腦層面占據(jù)先發(fā)地位。

在 Figure AI 推出 Helix、Physical Intelligence (PI) 發(fā)布 OpenVLA、π0 之前,行業(yè)對(duì)于如何實(shí)現(xiàn)機(jī)器人的通用智能尚存爭(zhēng)議。而當(dāng)這兩大硅谷的技術(shù)明星紛紛選擇 VLA(視覺-語言-動(dòng)作)路線后,端到端 VLA 模型逐漸成為業(yè)內(nèi)主流路線。

以往傳統(tǒng)機(jī)器人的應(yīng)用極度依賴定制化編程,這導(dǎo)致機(jī)器人只能在嚴(yán)格定義的工位里重復(fù)刻板動(dòng)作,一旦環(huán)境微調(diào)便會(huì)失效。

VLA 模型則能通過統(tǒng)一架構(gòu)將視覺感知、語言理解、動(dòng)作生成融于一體,實(shí)現(xiàn)端到端閉環(huán)控制,把人類自然語言指令、視覺場(chǎng)景信息直接映射為機(jī)器人可執(zhí)行的動(dòng)作。

雖然多數(shù)國(guó)內(nèi)廠商在 Helix、π0 發(fā)布之后才跟進(jìn)并開源相關(guān)的 VLA 模型,但也有不少公司早已做了相關(guān)研究,確立了相同的技術(shù)范式。

例如,在 Figure 和 PI 之前,智平方就已將端到端 VLA 模型明確為具身大模型的技術(shù)范式,并圍繞端到端物理世界模型持續(xù)推進(jìn)。

2024 年 6 月,智平方聯(lián)合北大將 Mamba 引入 VLA 架構(gòu)模型,推出了輕量化模型 RoboMamba(GOVLA0.0 版),它比 PI 的 OpenVLA 更早公開應(yīng)用。

相比當(dāng)時(shí) SOTA 的 Google RT 系列模型,該模型在參數(shù)規(guī)模上小 95%,但未見任務(wù)的泛化能力成功率高出約 60%,并被圖靈獎(jiǎng)得主 Yann LeCun 關(guān)注和點(diǎn)贊。

這意味著,在具身大模型這一關(guān)鍵方向上,中國(guó)并不是后來者,而是與全球最前沿力量幾乎同時(shí)探索。

這種對(duì)技術(shù)范式的預(yù)判,源于智平方創(chuàng)始人郭彥東在 AI 領(lǐng)域的深厚積淀。

郭彥東為美國(guó)普渡大學(xué)博士,師從兩位 AI 領(lǐng)域的美國(guó)工程院院士,擁有超過 15 年的 AI 學(xué)術(shù)研究與產(chǎn)業(yè)實(shí)踐經(jīng)驗(yàn)。

他起步于 AI 界的「黃埔軍校」——微軟美國(guó)總部,這里曾走出過像陸奇、沈向洋等改變 AI 格局的技術(shù)領(lǐng)袖。在微軟期間,他深度參與了核心 AI 技術(shù)的研發(fā),建立了對(duì)模型演進(jìn)的底層直覺。

此后,他先后擔(dān)任小鵬汽車和 OPPO 的首席科學(xué)家,主導(dǎo)過數(shù)億臺(tái)智能終端的 AI 落地。這種經(jīng)歷讓他既懂最前沿的算法,也懂如何在復(fù)雜的物理硬件上實(shí)現(xiàn)大規(guī)模應(yīng)用。

進(jìn)入 2025 年,智平方的 VLA 模型持續(xù)迭代,正式推出了全球首個(gè)全域全身 VLA 大模型 GOVLA。

常規(guī)的 VLA 模型往往只能輸出簡(jiǎn)單的機(jī)械臂動(dòng)作。Figure AI 頗負(fù)盛名的 Helix 模型的一大突破就是能夠不再限于機(jī)械臂,而是能夠?qū)崿F(xiàn)對(duì)人形機(jī)器人上半身的控制。

GOVLA 則更進(jìn)一步,首次實(shí)現(xiàn)了對(duì)人形機(jī)器人全身的控制與移動(dòng)軌跡的統(tǒng)一生成,從單臂操作擴(kuò)展到全身協(xié)同,讓 VLA 模型不再局限于固定桌面的任務(wù),能夠面向開放環(huán)境,機(jī)器人具備了從感知環(huán)境到規(guī)劃路徑再到全身協(xié)同作業(yè)的整體智力。

智平方創(chuàng)始人郭彥東博士舉了一個(gè)機(jī)器人做早餐的例子:

搭載常規(guī) VLA 大模型的機(jī)器人,需要人把食材放到桌面,放到機(jī)器人的可視范圍內(nèi),因?yàn)樗荒芸吹阶烂,只能在桌面操作,做完之后還需要人去給機(jī)器人提供服務(wù)。

而搭載 GOVLA 大模型的機(jī)器人能夠 360°感知周圍環(huán)境,可以自己去冰箱取食材,自己配比健康早餐,做完之后還可以送到餐桌,完成一個(gè)管家的全流程服務(wù)。這是一個(gè)機(jī)器人管家和一個(gè)自動(dòng)化設(shè)備的最大的區(qū)別。

隨后智平方開源了 FiS-VLA(GOVLA 0.5),進(jìn)一步引入快慢系統(tǒng)融合,在性能上超越國(guó)際標(biāo)桿π0 約 30%。

配合千卡級(jí)大算力集群、高效的訓(xùn)練加速方法與獨(dú)有的增量迭代方法,智平方實(shí)現(xiàn)了領(lǐng)先行業(yè) SOTA 70 倍以上的數(shù)據(jù)使用效率,為模型持續(xù)演進(jìn)提供了工程基礎(chǔ)。

這種技術(shù)上的前瞻性,解釋了為什么大摩將其列為全球基礎(chǔ)模型廠商的關(guān)鍵代表。

在大模型的博弈中,中國(guó)企業(yè)正在通過更早的范式鎖定和更高效的數(shù)據(jù)使用,拿回技術(shù)定義權(quán)。

訂單熱潮下的真與偽

具身大模型是具身智能企業(yè)技術(shù)的上限,商業(yè)化則是生存的底線。

據(jù)摩根士丹利統(tǒng)計(jì),2025 年下半年以來,中國(guó)具身智能廠商披露的訂單總額已超過 20 億元。

不過,繁榮之下暗藏水分。許多訂單屬于框架協(xié)議或示范性驗(yàn)證,呈現(xiàn)一種虛火的狀態(tài),缺乏明確的交付周期和深度耦合的生產(chǎn)流程,還存在買賣雙方背景不透明,交付沒有明確期限的情況。

多位行業(yè)人士表示,當(dāng)前不少巨額訂單更多是示范性需求驅(qū)動(dòng),而非由穩(wěn)定、長(zhǎng)期的真實(shí)需求形成。一旦交付效果不及預(yù)期,后續(xù)續(xù)購存在較大不確定性。

原力靈機(jī)聯(lián)合創(chuàng)始人唐文斌分析稱,一些項(xiàng)目看上去是商業(yè)化大單,但拆開來看,很難解釋它們真實(shí)解決了哪些問題,能否形成復(fù)購、是否能真正幫助企業(yè)降低成本或提升效率。

高盛的報(bào)告同樣佐證了這一觀點(diǎn)。今年 11 月,高盛調(diào)研了 9 家機(jī)器人供應(yīng)鏈上市公司,發(fā)現(xiàn)目前沒有一家公司確認(rèn)收到了大規(guī)模訂單或明確的生產(chǎn)時(shí)間表,處于「訂單荒」的狀態(tài)。

在這一背景下,能否給出明確交付路徑,成為區(qū)分公司的關(guān)鍵指標(biāo)。

智平方被大摩視為少數(shù)真實(shí)商業(yè)落地的代表性公司之一。其核心依據(jù)就是智平方與全球第三大面板廠惠科達(dá)成的 5 億元人形機(jī)器人訂單。

這筆訂單的特殊性在于五個(gè)明確:

明確的客戶:半導(dǎo)體顯示面板制造商 HKC(惠科股份);

明確的應(yīng)用場(chǎng)景:將用于 HKC 全球各地的半導(dǎo)體顯示面板生產(chǎn)基地;

明確的工作任務(wù):機(jī)器人將執(zhí)行倉庫物流、物料搬運(yùn)、部件組裝、質(zhì)量檢測(cè)等全流程任務(wù),從 PCB(印刷電路板)操作拓展到 OLED 真空層壓、耗材管理、廢料回收等環(huán)節(jié);

明確的臺(tái)數(shù):超 1000 臺(tái)機(jī)器人;

明確的交付周期:在未來三年內(nèi)完成部署。

同樣在半導(dǎo)體制造場(chǎng)景,智平方機(jī)器人還進(jìn)入吉利科技旗下晶能微電子生產(chǎn)基地,高效執(zhí)行上下料、產(chǎn)線間物料轉(zhuǎn)運(yùn)等任務(wù)。

除了半導(dǎo)體生產(chǎn)制造場(chǎng)景,智平方機(jī)器人也在汽車制造、生物科技、公共服務(wù)等大量真實(shí)場(chǎng)景運(yùn)行,通過技術(shù)復(fù)用實(shí)現(xiàn)跨場(chǎng)景的橫向泛化能力:

在汽車制造領(lǐng)域,多個(gè)國(guó)內(nèi)外頭部客戶在上下料、物流轉(zhuǎn)運(yùn)、貼標(biāo)簽、收納保護(hù)布等環(huán)節(jié)中進(jìn)行應(yīng)用探索,國(guó)產(chǎn)具身大模型首次獲得汽車制造全場(chǎng)景驗(yàn)證;

生物科技領(lǐng)域,與華熙生物合作,機(jī)器人執(zhí)行無菌車間的物料轉(zhuǎn)運(yùn)、智能拆包和視覺檢驗(yàn)等操作,替代人工在高風(fēng)險(xiǎn)區(qū)域的重復(fù)性勞動(dòng),有效降低交叉污染;

公共服務(wù)領(lǐng)域,今年第三季度開始進(jìn)入虹橋機(jī)場(chǎng)等國(guó)內(nèi)一線機(jī)場(chǎng)收納小推車。

文商旅領(lǐng)域,今年 12 月 28 日發(fā)布全球首個(gè)模塊化具身智能服務(wù)空間「智魔方」,集成咖啡、冰淇淋、娛樂、零售四大模塊,機(jī)器人在其中負(fù)責(zé)實(shí)現(xiàn)高擬真交互與自主服務(wù),未來三年計(jì)劃在全國(guó)落地 1000 個(gè)智魔方。

支撐這種規(guī);桓兜模司呱泶竽P唾x予的智能,還有以量產(chǎn)為導(dǎo)向的硬工程能力。

智平方在硬件側(cè)堅(jiān)持「為量產(chǎn)而設(shè)計(jì)」的原則,其 AlphaBot 系列強(qiáng)調(diào)工業(yè)級(jí)可靠性,核心部件無故障運(yùn)行超過 5 萬小時(shí)。

其輪式人形機(jī)器人 AlphaBot 2(愛寶)全身自由度超 34 個(gè),可連續(xù)工作 6 小時(shí),垂直工作范圍 0-2.4m,單臂臂展 70cm,能實(shí)現(xiàn) 360°×360°全空間探測(cè)感知。

同時(shí),智平方自建了產(chǎn)線,已于今年 9 月投產(chǎn),支持千臺(tái)級(jí)產(chǎn)能與快速擴(kuò)產(chǎn),并將在 2026 年擴(kuò)至萬臺(tái)規(guī)模。

對(duì)量產(chǎn)與可靠性的執(zhí)著,與公司創(chuàng)始人的背景強(qiáng)相關(guān)。

在微軟、OPPO、小鵬汽車任職過的郭彥東博士完整經(jīng)歷了 PC、手機(jī)和汽車三大智能終端的創(chuàng)新周期,在 AI 與硬件的深度結(jié)合上擁有豐富的量產(chǎn)經(jīng)驗(yàn)。

創(chuàng)始人跨越多代智能終端的經(jīng)驗(yàn),讓智平方從創(chuàng)業(yè)之初就明確,具身智能需要盡早進(jìn)入可復(fù)制、可交互的量產(chǎn)體系,否則技術(shù)優(yōu)勢(shì)很難走出實(shí)驗(yàn)室,轉(zhuǎn)化為真正的產(chǎn)業(yè)能力。

商業(yè)落地的意義一方面在于獲取收入,更重要的是釋放其背后的數(shù)據(jù)價(jià)值。規(guī);涞厮鶐淼拇罅繑(shù)據(jù)是具身大模型持續(xù)進(jìn)化的必要條件。擁有明確交付、落地規(guī)劃的訂單,能夠升級(jí)為企業(yè)的戰(zhàn)略資源。

智平方創(chuàng)始人郭彥東提出了「正反金字塔」數(shù)據(jù)觀。

在冷啟動(dòng)階段,具身智能模型主要依賴互聯(lián)網(wǎng)數(shù)據(jù)與仿真數(shù)據(jù)提供多樣性,再通過少量真機(jī)數(shù)據(jù)完成對(duì)物理約束的校準(zhǔn),這是一個(gè)「正金字塔」結(jié)構(gòu)。

而當(dāng)機(jī)器人開始在真實(shí)場(chǎng)景中規(guī);渴鸷,數(shù)據(jù)結(jié)構(gòu)隨之反轉(zhuǎn),來自生產(chǎn)現(xiàn)場(chǎng)的真實(shí)作業(yè)數(shù)據(jù),反而成為價(jià)值最高、最難復(fù)制的核心資產(chǎn),形成「倒金字塔」。

通過這種正反循環(huán),機(jī)器人能夠在真實(shí)環(huán)境中不斷迭代優(yōu)化,越用越聰明。

這種基于真實(shí)場(chǎng)景反饋的工程能力,正是頂級(jí)投行在篩選具備穿越周期潛力的公司時(shí),最為看重的能力之一。

行業(yè)終局,誰能走進(jìn)決賽圈?

目前,具身智能行業(yè)呈現(xiàn)出三種截然不同的生存形態(tài)。

第一類形態(tài)是重模型,輕本體。代表企業(yè)包括 PI、Skild AI 等。

這類公司團(tuán)隊(duì)構(gòu)成更偏向軟件與算法研究,在大模型與算法研究上具備明顯優(yōu)勢(shì),但缺乏自主的硬件工程化和量產(chǎn)能力,先進(jìn)模型很難轉(zhuǎn)化為可批量交付的產(chǎn)品。

機(jī)器人軟硬件是深度耦合的。對(duì)于這類公司而言,由于沒有自己的硬件底座,其高性能算法與其他大多數(shù)公司的具體硬件之間難以達(dá)成深度適配,導(dǎo)致技術(shù)只能停留在實(shí)驗(yàn)室環(huán)境,很難在真實(shí)場(chǎng)景中完成端到端的閉環(huán)驗(yàn)證與迭代優(yōu)化。

重模型、輕本體的路徑,雖然在技術(shù)爆發(fā)期能迅速積累聲望,但在商業(yè)閉環(huán)上面臨挑戰(zhàn)。這種困境不僅在具身智能領(lǐng)域出現(xiàn),在更廣泛的 AI 領(lǐng)域也是一樣,并且已有先例。純軟件類公司的最終歸宿,往往是加入巨頭,走向 Talent Acquisition(人才并購)。

一個(gè)最典型的近期案例就是 AI Agent 賽道的黑馬 Manus。

即便 Manus 在過去一年表現(xiàn)驚人——截至 2025 年 12 月,其年度經(jīng)常性收入(ARR)已突破 1 億美元,累計(jì)處理 Token 超過 147 萬億個(gè),服務(wù)了全球數(shù)百萬用戶。但就在 2025 年底,Manus 最終選擇整體加入社交巨頭 Meta,被其收購,Manus 創(chuàng)始人肖弘出任 Meta 副總裁。

對(duì)于 Manus 這種純軟件/算法驅(qū)動(dòng)的公司來說,加入擁有龐大算力資源和用戶生態(tài)的 Meta,是實(shí)現(xiàn)技術(shù)價(jià)值最大化的現(xiàn)實(shí)路徑。

同理,在具身智能領(lǐng)域,像 PI 這樣缺乏硬件支撐的純模型公司,未來大概率也會(huì)重走 Manus 的老路,通過被其他大公司收購來實(shí)現(xiàn)技術(shù)著陸。

第二類形態(tài)是重本體、輕模型。代表企業(yè)包括宇樹科技、眾擎機(jī)器人、加速進(jìn)化等。

這類公司憑借深厚的機(jī)械硬件底蘊(yùn)和成熟的供應(yīng)鏈管理,在成本控制上極具殺傷力,都推出了 10 萬元以下的人形機(jī)器人。

它們能夠快速實(shí)現(xiàn)產(chǎn)品的迭代與推新,通過低價(jià)策略迅速占領(lǐng)科研、教育等對(duì)交互要求較低的市場(chǎng)。

但其局限性也同樣顯著。今年以來,宇樹科技、眾擎機(jī)器人對(duì)機(jī)器人的更新多側(cè)重于空翻、跑步等運(yùn)動(dòng)控制能力的極限展示,重點(diǎn)提升「小腦」而非「大腦」,在涉及干活的智能化程度與泛化能力上探索較少,缺乏自研具身大模型的支撐。

第三類形態(tài)則是本體與模型并重的全棧派,代表企業(yè)包括特斯拉、Figure AI、智元機(jī)器人、銀河通用及智平方等。

這是投入周期最長(zhǎng)、難度最高的一條路徑,但也是最有可能跑通長(zhǎng)期閉環(huán)的路線。

全棧派企業(yè)都是在機(jī)器人大腦、量產(chǎn)、數(shù)據(jù)三個(gè)方面形成閉環(huán)的廠商。在這一模式下,模型決定上限,硬件決定下限,場(chǎng)景提供持續(xù)演化的燃料。

這種不偏科的系統(tǒng)性實(shí)力,在 2025 年的這一階段顯現(xiàn)出更強(qiáng)的爆發(fā)性。

智元機(jī)器人已經(jīng)連續(xù)收獲了多個(gè)億元級(jí)訂單,并且實(shí)現(xiàn)了 5000 臺(tái)通用具身機(jī)器人的量產(chǎn)下線。

銀河通用最近完成了國(guó)內(nèi)人形機(jī)器人最大單筆融資,金額超 3 億美元(約合人民幣 21 億元),除了數(shù)百家藥店的訂單外,還收獲了一筆 1000 臺(tái)規(guī)模,金額約 7 億元的人形機(jī)器人訂單。

行業(yè)正在從狂熱走向務(wù)實(shí)。單項(xiàng)能力或許能在早期獲得關(guān)注,但長(zhǎng)期來看可能會(huì)面臨增長(zhǎng)瓶頸,在規(guī);A段,系統(tǒng)性能力更有可能讓企業(yè)建立起難以跨越的護(hù)城河。

具身智能的競(jìng)爭(zhēng)在逐漸進(jìn)入深水區(qū),能把模型、本體與真實(shí)場(chǎng)景同時(shí)跑通的公司,將在持續(xù)交付中積累起數(shù)據(jù)與工程壁壘,進(jìn)入具身智能的決賽圈。

       原文標(biāo)題 : 全球頂級(jí)投行,篩選出了具身智能的終極答案

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)