訂閱
糾錯(cuò)
加入自媒體

AI新王與舊王:一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭

圖片

誰能更快轉(zhuǎn)動(dòng)那個(gè)飛輪?

文|徐鑫

編|任曉漁

時(shí)隔三年,大反轉(zhuǎn)。

上周一,OpenAI CEO山姆·奧特曼在內(nèi)部宣布啟動(dòng)“紅色代碼”行動(dòng),推遲其他一切產(chǎn)品開發(fā)專注ChatGPT,以應(yīng)對來自谷歌和其他對手的沖擊。三年前此時(shí),ChatGPT剛問世,拉響紅色警報(bào)的是谷歌這家老牌人工智能巨擘。

攻守易勢,恰恰映射出AI競爭當(dāng)下進(jìn)入的新周期。

OpenAI拉響警報(bào),在于這些大模型賽道的開啟者,突然發(fā)現(xiàn)自己通過不斷定義新戰(zhàn)場,圈用戶建生態(tài)形成的領(lǐng)先優(yōu)勢,正被人工智能舊王谷歌所逐漸侵蝕。

拉長時(shí)間線看,相比OpenAI這類在算法層面奪得先聲的公司,谷歌擁有的場景和生態(tài)能力當(dāng)下在拉鋸戰(zhàn)里占據(jù)主動(dòng)。場景-數(shù)據(jù)與大模型轉(zhuǎn)動(dòng)起來的效果超出了OpenAI的預(yù)期。

在國內(nèi),同樣的情形也在上演?伸`憑借著快手在APP時(shí)代的數(shù)據(jù)沉淀和場景快速從視頻生成賽道脫穎而出,而快手又為可靈健康造血以及模型迭代提供了閉環(huán)場景。群核科技憑借著應(yīng)用時(shí)代積累的海量物理正確的三維數(shù)據(jù),在空間智能時(shí)代在全球嶄露頭角。甚至最近大火的豆包手機(jī),也讓許多人意識到APP場景、數(shù)據(jù)在AI時(shí)代也關(guān)乎大模型能力閉環(huán)。

國內(nèi)外無論是AI原生玩家還是老牌巨頭,都在紛紛加速基于場景,構(gòu)建從數(shù)據(jù)-模型到生態(tài)能力的閉環(huán)。

而那些能在競爭里將“場景理解”有效轉(zhuǎn)化為“智能理解”的企業(yè),有望率先定義AI戰(zhàn)爭的下一章。

01

紅色警報(bào)背后,新王是舊王?

時(shí)隔三年,硅谷再次響起了紅色警報(bào)。

8月問世的Nano Banana以刷屏級表現(xiàn)驅(qū)動(dòng)了Gemini的用戶規(guī)模增長。9月13日,Gemini成功登頂美國地區(qū)AppStore免費(fèi)榜總榜,并于同日在其他77個(gè)國家和地區(qū)免費(fèi)榜位居第一。

圖片

11月谷歌在官方博客中提及Gemini月活躍用戶突破6.5億,這個(gè)數(shù)字較7月谷歌財(cái)報(bào)發(fā)布時(shí)公布的4.5億月活用戶(相比此前季度50%增長)再出現(xiàn)大幅增長,顯著縮小了與ChatGPT的8億月活差距。

人工智能之父Hinton日前對BusssinessInsider鮮明表達(dá)了對這場戰(zhàn)爭的態(tài)度,他甚至驚訝于谷歌到現(xiàn)在才翻身,“谷歌制造自己的芯片,有很多非常優(yōu)秀的研究員,顯然還有大量數(shù)據(jù)和數(shù)據(jù)中心”,因此谷歌會(huì)贏得戰(zhàn)爭。

一位AI行業(yè)資深人士告訴數(shù)智前線,場景和數(shù)據(jù)優(yōu)勢在當(dāng)下的智能競爭中是很重要的一環(huán)。谷歌此前的應(yīng)用場景里沉淀了大量用戶搜索意圖數(shù)據(jù),天然適配強(qiáng)化學(xué)習(xí)技術(shù)。用戶基于搜索的結(jié)果會(huì)有行為反饋,比如十個(gè)結(jié)果會(huì)點(diǎn)幾下,這種“決策-結(jié)果-反饋”,完美適配RLHF/RLAIF。在Scaling Law越來越重視后訓(xùn)練強(qiáng)化學(xué)習(xí)的背景下,它對模型智能至關(guān)重要。

可以說,AI戰(zhàn)爭,已經(jīng)不再是單一維度的模型參數(shù)規(guī)模的競爭,應(yīng)用時(shí)代的積累的生態(tài)與分發(fā)優(yōu)勢、技術(shù)與數(shù)據(jù)的閉環(huán),產(chǎn)品協(xié)同與場景落地,都左右著局勢。

無獨(dú)有偶,國內(nèi)戰(zhàn)場,同樣的情形也在上演。

無論是千問期望協(xié)同阿里體系內(nèi)高德、閃購等生態(tài)力量,打造一個(gè)會(huì)辦事的AIToC入口,還是豆包手機(jī)的Agent奇襲手機(jī)APP引發(fā)一眾超級應(yīng)用彈壓,都顯示出,AI時(shí)代的硝煙與上一個(gè)時(shí)代的戰(zhàn)局有著千絲萬縷的聯(lián)系。

實(shí)際上,視頻生成領(lǐng)域去年已經(jīng)上演過類似的腳本。

去年2月Sora的Demo視頻讓生成的人物、場景第一次真正地動(dòng)了起來,而不再是有動(dòng)效的圖片,OpenAI很自然地成了賽道的定義者。

之后的幾個(gè)月里,海內(nèi)外各路玩家及新興創(chuàng)業(yè)團(tuán)隊(duì)紛紛推出視頻生成類產(chǎn)品。去年6月,快手加入賽道,第一次凸顯出了場景和數(shù)據(jù)優(yōu)勢對戰(zhàn)局的影響。

不同于當(dāng)時(shí)Sora是期貨,可靈能真正試用,且效果經(jīng)驗(yàn),生成時(shí)長還達(dá)到分鐘級,這種節(jié)奏超過了原先的賽道定義者OpenAI。快手官方今年8月在財(cái)報(bào)發(fā)布會(huì)上提到,可靈AI單季度收入突破2.5億元。

圖片

與之對比,OpenAI的Sora1去年12月才上線,Sora2今年9月30日上線,推出后雖然收獲了一大票稱贊,但這位曾經(jīng)的市場教育者要從“玩具”進(jìn)化成“工具”挑戰(zhàn)重重——最近a16z合伙人Olivia Moore展示了一張APP數(shù)據(jù)監(jiān)測服務(wù)商Sensor Tower的截圖顯示,Sora的30天用戶留存率1%,60天用戶留存率接近0%。

擁有場景和應(yīng)用生態(tài)在AI時(shí)代的價(jià)值由此可見一斑?焓执饲安⒉凰鉇I第一梯隊(duì)玩家,但基于APP時(shí)代海量的場景沉淀和數(shù)據(jù)積累,快手沿襲Sora探出來的路,成功打造了一款有全球影響力的產(chǎn)品。

這也讓很多分析人士看到,中國過去十余年數(shù)字經(jīng)濟(jì)發(fā)展所沉淀下來的多元,豐富的場景及數(shù)據(jù)優(yōu)勢在當(dāng)下AI競爭里的價(jià)值和意義。同時(shí),一些人認(rèn)為,應(yīng)該重估那些上一個(gè)應(yīng)用時(shí)代拼出來的場景和數(shù)據(jù)的價(jià)值。

不過,這當(dāng)然并不意味著僅憑數(shù)據(jù)和場景就能自動(dòng)贏得戰(zhàn)爭。局勢的真實(shí)情況就像谷歌和OpenAI的位置輪替一樣,基模更迭如同出回合制決斗,各方都在加速補(bǔ)課,看誰能更快轉(zhuǎn)動(dòng)那個(gè)飛輪。

是AI原生玩家們基于AI原生能力穿透用戶心智,構(gòu)建出用戶與AI迭代的閉環(huán),還是上一個(gè)時(shí)代的老炮們依托場景數(shù)據(jù)積累,快速將場景和數(shù)據(jù)優(yōu)勢轉(zhuǎn)換成模型優(yōu)勢,比拼的還是決心、敏捷和執(zhí)行力。

一場圍繞著數(shù)據(jù)飛輪的纏斗已經(jīng)打響。

02

空間智能,呼喚智能飛輪

作為AI發(fā)展演進(jìn)的前沿賽道以及人工智能的下半場,空間智能領(lǐng)域里同樣的邏輯正在復(fù)現(xiàn)——場景、數(shù)據(jù)和智能能否形成迭代閉環(huán),正關(guān)乎行業(yè)能否加速從實(shí)驗(yàn)室走向產(chǎn)業(yè)規(guī)模落地。

一位行業(yè)資深人士告訴數(shù)智前線,目前整個(gè)空間智能領(lǐng)域可以類比為大語言模型的GPT-2階段。在這一階段里,技術(shù)路線激烈碰撞,基礎(chǔ)能力還在積累,行業(yè)的Scaling Law仍待發(fā)現(xiàn)。

全行業(yè)需要努力實(shí)現(xiàn)技術(shù)路線收斂,同時(shí)破解高質(zhì)量大規(guī)模的3D數(shù)據(jù)稀缺瓶頸,基于場景加速數(shù)據(jù)-模型迭代,才能推動(dòng)空間智能的涌現(xiàn)。

用更直白的話說,整個(gè)行業(yè)都在呼喚著空間智能領(lǐng)域能構(gòu)建起一個(gè)數(shù)據(jù)飛輪。

行業(yè)內(nèi)玩家正從不同層面來加速這一進(jìn)程。

比如人工智能教母李飛飛的世界模型Marble、GoogleDeepMind推出的世界模型Genie3、Meta的三維重建模型SAM3D和國內(nèi)的騰訊混元3D世界模型以及英偉達(dá)的Cosmos世界基礎(chǔ)模型(WFM)等,它們的能力涉及到空間的重建、生成、推理、交互等多個(gè)層面。

但作為一個(gè)還處在發(fā)展早期的領(lǐng)域,這些不同層面的能力很少在一個(gè)體系內(nèi)能讓人真正廣泛地用起來。這無疑不利于整個(gè)行業(yè)內(nèi)構(gòu)建數(shù)據(jù)飛輪,實(shí)現(xiàn)技術(shù)落地。

而國內(nèi)最早做物理世界模擬的群核科技率先做了一個(gè)決定:將14年來沉淀的底層空間能力匯聚在自己的Aholo空間智能開放平臺,全面開放給行業(yè)。其中包括其模型層和工具層的空間重建、空間生成、空間編輯與空間理解在內(nèi)的能力,將以API/SDK的形式逐步對外開放。

圖片

空間重建借助3DGS技術(shù)能夠快速1:1復(fù)制物理世界到數(shù)字世界?臻g生成則是從0到1創(chuàng)造3D空間,幾句話描述或者給模型一張照片,模型就能生成三維場景。今年國內(nèi)外空間生成模型動(dòng)態(tài)頻頻,是空間智能領(lǐng)域“新王們”的一個(gè)核心押注方向?臻g編輯解決了當(dāng)下AIGC無法二次編輯調(diào)整的痛點(diǎn),讓AI生成的空間內(nèi)容不再是“黑箱產(chǎn)物”?臻g理解則是包括具身智能等智能體看懂眼前物理世界的基本能力。

外界看來,這四重能力集中在一個(gè)平臺,其實(shí)有助于加速行業(yè)推進(jìn)空間智能的應(yīng)用和落地進(jìn)程,加速基于場景數(shù)據(jù)-應(yīng)用反饋與迭代的閉環(huán)。

原來重建工作主要靠CAD圖紙等去做一些數(shù)字化,真實(shí)世界數(shù)據(jù)與數(shù)字世界數(shù)據(jù)之間有GAP。而3DGS技術(shù)和空間生成能力協(xié)同,相當(dāng)于打開了內(nèi)容的新的源頭,打破了過往高質(zhì)量3D數(shù)據(jù)的瓶頸。

“源頭打開了,才會(huì)有人把內(nèi)容導(dǎo)入到工具平臺,用戶才會(huì)進(jìn)來完成后面的編輯跟推理工作”,一位行業(yè)資深人士指出。

空間編輯可以視作數(shù)據(jù)優(yōu)化與交互界面。此前群核就已通過酷家樂等產(chǎn)品載體將之用在空間設(shè)計(jì)、電商3DAI設(shè)計(jì)、工業(yè)柔性制造等場景中。

現(xiàn)在進(jìn)一步對外開放,隨著更多數(shù)據(jù)導(dǎo)入,有了編輯工具就像語言模型的多輪對話能更好校準(zhǔn)用戶需求提升回答準(zhǔn)確性一樣,專業(yè)人士借助工具鏈去做更加深度編輯。比如把商品放入到構(gòu)建好的數(shù)字空間里,設(shè)計(jì)師能自由編輯,產(chǎn)出更符合個(gè)性需求的高品質(zhì)內(nèi)容物料。

“市場才剛剛開始,談不上競爭。行業(yè)當(dāng)下最需要的是底層技術(shù)的‘賣水人’,我們希望空間智能能夠更快向前。”群核科技董事長黃曉煌在媒體溝通環(huán)節(jié)告訴數(shù)智前線。

隨著算力的提升,當(dāng)下無論是空間設(shè)計(jì)、XR、影視短劇、文化遺產(chǎn)保護(hù)等3D內(nèi)容創(chuàng)作領(lǐng)域,還是工業(yè)數(shù)字孿生、機(jī)器人仿真訓(xùn)練等對3D結(jié)構(gòu)化數(shù)據(jù)有高要求的場景,對高質(zhì)量、可交互、可計(jì)算的3D場景和數(shù)據(jù)的需求都在急劇攀升。

那些能夠把物理世界和數(shù)字世界更好連接起來的技術(shù)能夠開放出來,無疑對行業(yè)早期是一個(gè)巨大的驅(qū)動(dòng)。

03

一家公司的飛輪和中國AI的飛輪

而對群核這家公司來說,隨著越來越多用戶使用,反饋沉淀,其自身的數(shù)據(jù)飛輪正在增強(qiáng)。

這家從空間設(shè)計(jì)軟件起家的公司,現(xiàn)在已經(jīng)是全球最大的空間設(shè)計(jì)平臺。群核有著全球最多元龐大的空間場景沉淀,并且,由于空間設(shè)計(jì)最終都要真實(shí)落地,讓其沉淀的數(shù)據(jù)具備了獨(dú)特的物理正確屬性,符合物理規(guī)律。在空間智能時(shí)代,這些都成為了構(gòu)建強(qiáng)大空間智能模型的燃料。今年它也正式推出了業(yè)界首個(gè)專注于3D室內(nèi)場景認(rèn)知與生成的空間大模型?梢哉f,群核自身已經(jīng)形成了一個(gè)正向循環(huán)的飛輪。

空間編輯工具帶來了空間場景和數(shù)據(jù)的沉淀,海量的數(shù)據(jù)加速了空間大模型迭代。而隨著此次更多的能力對外開放,群核完成了數(shù)據(jù)-大模型-工具能力的全鏈路開放,這家公司又有機(jī)會(huì)獲得更豐富更開放多維的場景和數(shù)據(jù)沉淀,真正成為一個(gè)空間智能的基礎(chǔ)設(shè)施平臺。正向循環(huán)的數(shù)據(jù)飛輪有望更加速運(yùn)轉(zhuǎn)。

圖片

目前在一些場景里,群核已經(jīng)與一些合作伙伴探索測試基于Aholo平臺四項(xiàng)能力在同一個(gè)工作流去應(yīng)用落地。比如工廠數(shù)字孿生和仿真場景,一些成熟的工廠需要引入智能化設(shè)備;谌汉诉@套能力去做模擬仿真,可以大大降低不合理設(shè)計(jì)帶來的成本浪費(fèi)。

另一方面,從數(shù)據(jù)到模型到底層能力的全面開放,對群核而言,也意味著從3D空間軟件提供商走向了空間智能服務(wù)提供商。

黃曉煌提到,空間智能此前更多是群核內(nèi)生的能力,之所以通過Aholo平臺開放出來,是因?yàn)樗麄冋J(rèn)知到時(shí)代在發(fā)生變化。能力開放后滾動(dòng)而來的新的數(shù)據(jù)和能力進(jìn)一步讓群核的應(yīng)用有了迭代。

他們剛剛發(fā)布的3D AI內(nèi)容創(chuàng)作工具LuxReal就是一個(gè)代表。通過空間大模型和工具的相互補(bǔ)充,LuxReal或許能夠補(bǔ)足現(xiàn)有視頻生成模型時(shí)空不一致和不可控的問題。這或許是全球第一個(gè)3D 視頻生成Agent。

“今年以來包括Deepseek在內(nèi)的一批公司都一開始就把底層能力暴露出來,大家有一種一起推動(dòng)行業(yè)往前走的勢頭,我們也順勢而為。”他認(rèn)為,空間智能正處于發(fā)展早期階段,基于開放的平臺,整個(gè)行業(yè)能一起解決問題,突破技術(shù)瓶頸。

外界觀察來看,這可能也是當(dāng)下新一批中國公司開放創(chuàng)新浪潮的一個(gè)縮影。中國創(chuàng)新企業(yè)正進(jìn)入新的階段,既能參與最前沿賽道最前沿戰(zhàn)場的創(chuàng)新,也以開放和共享的姿態(tài),有成為行業(yè)基礎(chǔ)設(shè)施的能力和意愿。

這種角色變化里其實(shí)也能窺見中國企業(yè)在人工智能時(shí)代里的一種可能的成長路徑。

以群核和快手這批企業(yè)為例,過往在應(yīng)用時(shí)代,基于場景沉淀出數(shù)據(jù),今天正在成為推進(jìn)AI發(fā)展的重要燃料,它進(jìn)一步帶動(dòng)了企業(yè)在新興賽道智能飛輪的形成。可以說,應(yīng)用優(yōu)勢,在全新的人工智能時(shí)代仍有回響。

中國整體在移動(dòng)互聯(lián)網(wǎng)時(shí)代強(qiáng)大的應(yīng)用場景和海量數(shù)據(jù)積累,能否推動(dòng)中國AI更快構(gòu)建這種場景-數(shù)據(jù)和智能的飛輪,實(shí)現(xiàn)從場景到智能的躍遷?從這個(gè)意義上看,當(dāng)下中國AI也需要加速構(gòu)建這一輪智能飛輪。

       原文標(biāo)題 : AI新王與舊王:一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號