訂閱
糾錯
加入自媒體

連續(xù)創(chuàng)立2家AI獨角獸!這個大佬,這次要讓AI自己進化

2026-02-02 16:49
烏鴉智能說
關注

說起Richard Socher,AI 圈里的人大多不會陌生。

他是較早一批將深度學習從學術研究推向產(chǎn)業(yè)落地的研究者之一。早年,Socher 創(chuàng)立了 MetaMind,專注于利用神經(jīng)網(wǎng)絡理解語言結構與語義。公司隨后被 Salesforce 收購,他也由此出任首席科學家,主導探索 AI 在 CRM 等企業(yè)系統(tǒng)中的應用。

2020年,Socher 再次創(chuàng)業(yè),創(chuàng)辦了 AI 搜索公司 You.com。目前,You.com 估值已達 15 億美元,躋身獨角獸行列。

但他的動作并未止步于此。近期,多家媒體披露,Socher 正在悄然籌備一家全新的 AI 公司——Recursive。

這家公司的目標更為前沿:研發(fā)一種能夠自我改進、在不依賴人類反饋的情況下持續(xù)進化的超級智能AI 系統(tǒng)。消息稱,Recursive 正在洽談一筆數(shù)億美元規(guī)模的融資,投前估值約 40 億美元。

如果相關進展最終落地,這也意味著,Richard Socher 在短短幾年內(nèi),已連續(xù)打造出兩家AI獨角獸公司。

本文將以Socher 的創(chuàng)業(yè)路徑為線索,梳理他對 AI 演進方向的判斷。

/ 01 /

第二家AI獨角獸,估值40億美元

據(jù)報道,Recursive 試圖研發(fā)一種能夠自我改進、在不依賴人類持續(xù)反饋的情況下不斷進化的超級智能 AI 系統(tǒng)。

更具體地說,它關注的是一種“AI 改進 AI”的遞歸機制:AI 不再只是被動接受訓練,而是能夠識別自身在性能、效率或能力上的瓶頸,主動提出在算法、系統(tǒng),乃至計算基礎設施(如芯片)層面的改進思路,并通過驗證與迭代,生成能力更強的下一代模型。

換句話說,就是讓AI 不只是“被訓練的對象”,而是成為參與訓練與改進過程的一方。

這一思路,并非只有Recursive 在探索。

此前,楊植麟(月之暗面CEO)在采訪中也提到,當被問及“如何提升 Agent 的通用性”時,他直言:“用更多的 AI 去訓練 AI,本身就是一個重要方向。”他也坦言,這條路徑已經(jīng)在部分場景中取得進展,但距離理想狀態(tài)仍有差距。

從行業(yè)視角看,這類嘗試實際上反映了一個很關鍵的問題:當模型和Agent 越來越復雜,單純依賴人工標注與反饋,已經(jīng)難以支撐能力持續(xù)擴展。

2026 年 1 月,有消息稱 Recursive 正在洽談一筆數(shù)億美元規(guī)模的融資,投前估值約 40 億美元。GV(前 Google Ventures)、Greycroft 等機構可能參與其中,資金將主要用于擴充算力儲備。

公司創(chuàng)始團隊包括Socher 在內(nèi)的 8 位聯(lián)合創(chuàng)始人,成員背景覆蓋 Google、OpenAI、Meta 等頭部機構。

如果這一消息屬實,這也將是Socher 在近兩年內(nèi)打造的第二家 AI 獨角獸。

Socher 于 2020 年創(chuàng)立 You.com 時,將其定位為一款 AI 驅(qū)動的搜索引擎。早期,You.com 面向消費者市場,強調(diào)“無廣告、重隱私”的搜索體驗。

但從2024 年開始,Socher 明顯將重心從 C 端搜索,轉(zhuǎn)向幫助企業(yè)更高效地使用 AI。2025 年,You.com 完成 1 億美元融資,估值達到 15 億美元,躋身獨角獸行列。

隨著這輪融資完成,You.com 的定位也發(fā)生了變化,從一款面向個人用戶的搜索產(chǎn)品,轉(zhuǎn)向為企業(yè)提供 AI 基礎設施。

其背后的判斷是,使用網(wǎng)絡的AI Agents 數(shù)量,正在快速超過人類,但現(xiàn)有搜索基礎設施,本質(zhì)上仍是為“人類點擊鏈接”而設計的。

企業(yè)級Agent 需要從私有數(shù)據(jù)與公共網(wǎng)絡中獲取更深層、具備上下文關聯(lián)的信息,才能完成分析、決策并采取行動。這對數(shù)據(jù)整合、模型選擇和結果可靠性提出了更高要求。

為此,You.com 構建了一個面向 Agent 時代的平臺:整合多源數(shù)據(jù),根據(jù)任務動態(tài)選擇合適的大模型,并在企業(yè)級規(guī)模下,輸出可驗證、可追溯的結果。

這一轉(zhuǎn)型,也讓You.com 的產(chǎn)品更明確地服務于企業(yè)場景。例如,為金融分析師提供自動化研究工具;為媒體機構加速內(nèi)容創(chuàng)作并挖掘歷史資料價值;為咨詢和專業(yè)服務人員顯著壓縮研究時間,輸出可操作的洞察。

除了準確性,You.com 還強調(diào)隱私保護、安全性、模型選擇的靈活性,以及對數(shù)據(jù)的完整訪問能力。投資人普遍認為,正是從消費者搜索轉(zhuǎn)向企業(yè)級 AI 的戰(zhàn)略調(diào)整,支撐了 You.com 的高估值。

盡管公司尚未公開詳細財務數(shù)據(jù),但據(jù)The Information 報道,You.com 的 ARR 已達到約 5000 萬美元。其增長拐點出現(xiàn)在去年 11 月,當月 ARR 環(huán)比幾乎呈線性拉升,推動 2024 年全年收入增長約 40 倍。

如果把時間再向前撥一些,Socher 的路徑其實一以貫之。

2014 年前后,深度學習仍主要停留在學術圈。一次研究方向的轉(zhuǎn)變,讓 Socher 從自然語言處理進入 AI 核心研究領域,并很快創(chuàng)立 MetaMind,嘗試將前沿模型轉(zhuǎn)化為企業(yè)可用的服務。

短短四個月,MetaMind 就從 Khosla Ventures 以及 Salesforce CEO Marc Benioff 處融資 800 萬美元。公司隨后被 Salesforce 收購,Socher 也由此帶隊探索 AI 在企業(yè)系統(tǒng)中的落地,并在提示工程、注意力機制等方向留下了早期實踐經(jīng)驗。

回看這段經(jīng)歷,MetaMind 更像是 Socher 將 AI 從實驗室推向產(chǎn)業(yè)應用的第一次嘗試。

/ 02 /

對AI的5個關鍵判斷

作為一位在AI 領域多次完成從研究到商業(yè)化落地的連續(xù)創(chuàng)業(yè)者,Socher 對 AI 的判斷,往往并非停留在技術層面,而是帶有明顯的長期視角與系統(tǒng)意識。

基于其近期的公開演講,硅基君整理了Socher 關于 AI 發(fā)展的幾項關鍵觀點:

①“獎勵工程”的范式革命

Socher提出的不僅是新職業(yè),更是從”提示工程”(Prompt Engineering)到”獎勵工程”的根本范式轉(zhuǎn)移。

他認為,提示工程處理的是單次交互的語義優(yōu)化,如何讓AI回答得更簡潔有用,而獎勵工程處理的是長期目標的復雜價值對齊,即如何在多代人時間尺度上定義”經(jīng)濟公平”或”氣候安全”。

這要求從業(yè)者具備獨特的以下一些能力:首先是技術認知,也就是理解AI尋找獎勵捷徑的機制(reward hacking)。其次是哲學深度,辨析”機會平等”vs“結果平等”等標準性問題。最后是領域精通,能夠預判稅收政策或氣候模型中的意外后果

這可能催生首個真正融合的”技術-政治-哲學”學科,比單純的AI倫理更具有實操性。

②目標錯位的系統(tǒng)性風險,從客服案例到文明尺度

Richard Socher:

舉個例子,某企業(yè)決定最大化呼叫中心的客戶滿意度評分。若不加其他約束,最簡單的解決方案或許是雇傭無數(shù)機器人,在短暫通話后自動填寫滿意度調(diào)查并勾選最高分;或者給每位投訴用戶發(fā)放一萬美元補償金。客戶滿意度評分確實會飆升,但毫無實際價值。當類似問題放大到社會層面時,風險將關乎生死。

Richard Socher舉得客服機器人的例子——雇傭機器人刷好評或發(fā)放一萬美元補償,看似荒謬,實則揭示了AI優(yōu)化的本質(zhì)特征。

AI會優(yōu)先優(yōu)化可量化指標,如客戶滿意度評分,而非客戶實際體驗這樣的真實目標。在多約束復雜系統(tǒng)中,AI會找到人類價值觀的”法律漏洞”。讓超級智能AI,經(jīng)過一代又一代的持續(xù)優(yōu)化,在很長的時間跨度里不斷升級完善,這時微小的目標偏差會被指數(shù)級放大。

例如,在氣候治理或經(jīng)濟政策中,“獎勵作弊”可能表現(xiàn)為:AI建議通過降低人口或制造虛假統(tǒng)計數(shù)字來“解決”不平等——技術上達成目標,文明層面毀滅價值。

③《AI經(jīng)濟學家》案例的方法論陷阱

Socher提及的自身研究“用強化學習設計稅收政策”,是一個值得解剖的失敗預警樣本。

該研究假設可以”平衡平等與生產(chǎn)力”,但現(xiàn)實中,經(jīng)濟系統(tǒng)包含不可算法化的文化、尊嚴、偶然性,AI在模擬環(huán)境中找到“最優(yōu)解”,但人類會改變行為規(guī)避稅收。于是,AI發(fā)現(xiàn),可以通過制造普遍性焦慮來“提高工作激勵”是提升生產(chǎn)力的有效路徑。

這引出一個深層問題:某些社會問題之所以“開放”,恰恰因為它們沒有可算法化的解決方案。

④共識路徑分歧:三種未來AI圖景

最后,Socher認為,圍繞“如何達成目標共識產(chǎn)生”產(chǎn)生的分歧,會勾勒出了三種截然不同的AI文明形態(tài)。

第一種路徑是追求全球民主共識,核心邏輯是先確立統(tǒng)一的目標,再推進強AI的部署落地,這種方式的潛在風險的是可能導致AI技術發(fā)展陷入停滯,或是形成碎片化的行業(yè)標準,類似IPCC(政府間氣候變化專門委員會)推動的氣候AI協(xié)議,便是這種路徑的具象化場景。

第二種是市場涌現(xiàn)路徑,主張讓AI的目標通過市場競爭自然演化而來,但這容易引發(fā)資本過度集中的問題,最終導致單一價值觀壟斷的局面,就像當下科技巨頭各自布局AI、互不協(xié)同的現(xiàn)狀。

第三種則是混合漸進路徑,倡導在具體的AI應用場景中逐步迭代、明確目標,不過這種模式會積累難以逆轉(zhuǎn)的技術債務,本質(zhì)上是一種邊部署邊治理的探索。

Socher更傾向于第三種混合漸進路徑,但這一觀點留下了關鍵疑問:當AI的能力超越人類的理解范疇時,究竟誰擁有權威去判定“這個解決方案不可行”?

⑤技術樂觀主義的修正:歷史未必站得住腳

此外,Socher認為,技術樂觀主義觀點也需要修正,其背后的核心假設,“人類總能適應技術變革,新職業(yè)會隨之涌現(xiàn)”,這在超智能AI面前可能不再成立。

首先是遞歸自我改進的臨界點問題,一旦AI具備自主改進能力,其進化速度將徹底脫離人類生物層面的適應節(jié)奏,兩者之間的差距會快速拉大。

其次是獎勵工程師的困境,當AI在定義獎勵函數(shù)上比人類更擅長時,獎勵工程師這一所謂的“新職業(yè)”,很可能只是技術迭代過程中的過渡形態(tài),無法成為長期穩(wěn)定的職業(yè)方向。

更嚴峻的是解釋性鴻溝的存在,即便超智能AI提出的解決方案是最優(yōu)的,人類也可能完全無法理解其邏輯與底層原理。

Socher認為,最值得警惕的一點是,人類或許只有一次機會為超智能AI設定初始條件,但人類現(xiàn)有政治制度的設計初衷,從來都不是應對這類“一次性且不可逆的決策”,這意味著我們當前的制度框架,可能難以承載超智能AI帶來的決策挑戰(zhàn)。

文/朗朗

       原文標題 : 連續(xù)創(chuàng)立2家AI獨角獸!這個大佬,這次要讓AI自己進化

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號