訂閱
糾錯
加入自媒體

誤差不到400票!16歲CTO帶隊,用5000個AI押中了美國選舉

不找人聊,就能知道人在想什么?一群00后正在用AI改寫調(diào)研行業(yè)。

2024年,一群平均年齡18歲的年輕人用約5000次AI對話(每次僅需30-90秒),便以接近零的成本,成功預(yù)測了美國紐約州民主黨初選的結(jié)果,票數(shù)誤差不到400張。

不到兩年,這群年輕人所創(chuàng)立的AI調(diào)研公司Aaru,已拿下埃森哲、安永和IPG等頂級合作伙伴,并在2025年底以10億美元估值完成5000美元A輪融資。

這一切的背后,是一個簡單到近乎狂妄的理念——用“無限模擬”取代“有限樣本”。

Aaru的核心不是讓AI變得更會“問問題”,而是讓AI學會“當人”。他們訓練了成千上萬個AI智能體,每個都被賦予復(fù)雜的人口屬性和行為認知模式,像一個微縮版的真人。

當這些“合成人”在數(shù)字世界里相互作用,就能回答以前無法回答的問題,如人群面對新產(chǎn)品、新政策或新廣告時的集體反應(yīng)。

Aaru所代表的“合成行為”處于技術(shù)棧頂層,它正與其他“合成互動”(如Keplar、Outset)與“合成數(shù)據(jù)”(如Gretel、YData)的探索者,重塑價值800億美金的調(diào)研市場。 

/ 01 /

當AI Agents像人一樣思考

當市面上大多數(shù)AI競爭者還在圍繞“如何更高效地收集人的洞察”展開角逐時,Aaru的思路有點不一樣:如果不依賴真實的人,而是直接“合成”出無限個能模擬人類行為的數(shù)字智能體,來預(yù)測群體反應(yīng)呢?

他們的核心叫做“仿真預(yù)測”,“建模-模擬-預(yù)測”,主打一個“如果……會怎樣?”的動態(tài)推演。

技術(shù)路徑是訓練出大量AI Agents(多智能體系統(tǒng),MAS),這些Agent依賴于多個來源的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),如社會經(jīng)濟統(tǒng)計、消費者行為數(shù)據(jù)、社交媒體情緒信號等。

每個智能體不僅攜帶年齡、收入等標簽,更被賦予了行為模式、決策動機甚至認知偏好,相當于一個個“仿真用戶”。

把這些智能體組合起來,就形成了一個動態(tài)、可交互的人類行為知識庫。換句話說,這不止是合成數(shù)據(jù),它直接合成了人。

 

圖片

比如,Aaru訓練出特定人群標簽如“25-30歲一線城市白領(lǐng)”后,會模擬其決策邏輯,例如面對企業(yè)新產(chǎn)品時是否購買、面對公共事件時的態(tài)度傾向等。

這些“合成人”能做什么?

Aaru找到了一個極致展現(xiàn)自身優(yōu)勢的“燈塔場景”——政治選舉預(yù)測。

他們用約5000次AI問答(每次僅需30-90秒),成功預(yù)測了2024年美國紐約州民主黨初選的結(jié)果,與實際票數(shù)相差不足371票,而成本據(jù)稱只有傳統(tǒng)民調(diào)的1/10。

如果交給傳統(tǒng)市場調(diào)研,可能耗時數(shù)周、花費數(shù)十萬美元。

這個場景具有結(jié)果公開、驗證周期短、勝負分明的特點,其成功預(yù)測且成本極低,成為了其技術(shù)能力的“鐵證”。

Aaru的準確率也得到了認可。IPG(洲際傳播集團)的首席解決方案官評價,Aaru的準確度“高于任何網(wǎng)站調(diào)查、民調(diào)或焦點小組”。

除了政治選舉,Aaru的應(yīng)用還伸展到企業(yè)決策和公共策略等領(lǐng)域。項目規(guī)模也能彈性縮放,從幾個智能體的小測試到十萬量級的大規(guī)模模擬都能支持。

目前,Aaru的產(chǎn)品主要分為三塊:

①Lumen,面向企業(yè)決策模擬。它能模擬企業(yè)高管、高凈值客戶等難以觸達的群體,用于產(chǎn)品概念測試、超定向營銷策略驗證等。目標受眾如“每年消費3萬美元購買手袋的人群”,“農(nóng)村市場中患有糖尿病的新手父母”。

②Dynamo模擬人性,專注于選舉預(yù)測。通過讓大量智能體持續(xù)接收并處理信息,模擬選民接觸媒體并更新觀點)。在政治選舉場景中,每個AI智能體會持續(xù)接收信息,模擬真實選民如何獲取媒體內(nèi)容并更新觀點,從而替代傳統(tǒng)民調(diào)來預(yù)測選舉結(jié)果。

③Seraph,則為公共部門設(shè)計,其支持配置任意時間、地點和媒介環(huán)境,用于在動態(tài)環(huán)境中模擬輿情與信息傳播,以輔助高風險決策。

目前,Aaru已經(jīng)與IPG合作成立了“模擬工作室”(Simulation Studio)。

簡單來說,IPG將把Aaru的“人群模擬”能力,接入自家的消費者數(shù)據(jù)平臺Acxiom。這意味著,在合法合規(guī)使用數(shù)據(jù)的前提下,模擬出的人群畫像將更精細、更貼近現(xiàn)實,從而幫助品牌進行細分和市場觸達。

值得一提的是,推動這套設(shè)想落地的,是一個平均年齡僅18歲的年輕團隊,其中公司的CTO更是只有16歲。

Cam Fink,20歲,聯(lián)合創(chuàng)始人&CEO,有Kleiner Perkins、RSI等機構(gòu)工作/研究經(jīng)歷;

Ned Koh,20歲,聯(lián)合創(chuàng)始人,曾就讀于哈佛大學,有西北大學研究、創(chuàng)企聯(lián)創(chuàng)的經(jīng)歷;

John Kessler,16歲,聯(lián)合創(chuàng)始人&CTO。

數(shù)據(jù)是新的黃金。Aaru正用一套近乎科幻的方法,嘗試撬動依賴經(jīng)驗和樣本的傳統(tǒng)調(diào)研行業(yè),巨頭們的入場與合作,已經(jīng)是一個不容忽視的信號。

/ 02 /

用“無限模擬”,取代“有限樣本”

800億美金調(diào)研市場背后的勞動力體量龐大,傳統(tǒng)模式的核心是“抽樣-詢問-統(tǒng)計”,其瓶頸在于樣本的有限性、成本的高昂與反饋的滯后。

AI正以兩種路徑重塑這個行業(yè):

(1)訪談增強類

第一類公司聚焦于研究流程的“前臺”,用AI模擬互動過程(訪談),但仍與真人交互。

壁壘在于自然交互技術(shù)和流程自動化,通過規(guī);@取定性洞察,捕捉語氣、表情等非語言線索,試圖獲取更深層的情感與行為洞察。

①AI語音訪談?wù){(diào)研Keplar

Keplar是一款A(yù)I語音訪談平臺,用語音AI替代傳統(tǒng)人工訪談。其亮點在于多模態(tài)對話真實性:AI主持人能以"Ellie""Andrew"等擬人化身份進行語音訪談,參與者常忘記對方是AI,對話錄音中甚至能聽到直呼AI名字的自然互動。

它將任意產(chǎn)品問題轉(zhuǎn)化為訪談指南,直接調(diào)取CRM客戶名單并發(fā)數(shù)百通語音訪談,實時分析回答主題。

與傳統(tǒng)調(diào)研公司相比,將訪談周期從數(shù)周壓縮至數(shù)小時,成本降至幾十分之一。差異化在于語音優(yōu)先,通過語音語調(diào)、停頓節(jié)奏建立信任,獲取更深層的情感化反饋,其交付物是可直接用于匯報的PPT和報告,而非原始數(shù)據(jù)。

②視頻深度訪談Listen Labs

Listen Labs是紅杉資本重注的AI用戶研究平臺,累計融資2700萬美元。其獨特之處在于視頻訪談的深度與規(guī)模平衡:AI主持人可進行視頻訪談,參與者通過視頻、語音、文字或屏幕共享回應(yīng),還原了面對面訪談的豐富度。

核心差異是視頻+AI分析的組合。平臺強調(diào)"定量規(guī)模的定性深度",能同時執(zhí)行數(shù)百個視頻訪談,AI自動編碼回答、識別主題并生成報告。

Listen Labs捕捉視覺線索,如表情、操作行為、環(huán)境背景,更適合UX研究和產(chǎn)品測試。其客戶覆蓋消費品、醫(yī)療等大型企業(yè)。

③AI主持人訪談Outset

Outset專注AI主導的深度訪談,總?cè)谫Y2100萬美元,由8VC領(lǐng)投、貝恩資本參與。其平臺讓AI主持人通過視頻/語音與數(shù)千名參與者對話,自動合成結(jié)果。

核心亮點是超大規(guī)模與速度:25個深度訪談傳統(tǒng)需4-6周,Outset可在1周內(nèi)完成250個訪談并自動分析,速度提8倍、成本降81%倍。

差異化在于全研究流程自動化,從創(chuàng)建討論指南、招募受訪者到分析結(jié)果、生成報告,研究團隊只需輸入研究問題,平臺自動處理其余環(huán)節(jié)。

客戶包括雀巢、微軟、慧儷輕體等500強企業(yè)。與Listen Labs相比,Outset更強調(diào)端到端自動化和企業(yè)級集成能力,適合需要快速、大規(guī)模獲取客戶"為什么"的復(fù)雜研究項目。

④神經(jīng)營銷AI平臺Neurons

Neurons專注廣告和創(chuàng)意效果預(yù)測,基于認知神經(jīng)科學、機器學習與心理學構(gòu)建。其亮點是秒級注意力預(yù)測:上傳廣告素材,AI在數(shù)秒內(nèi)生成熱力圖,預(yù)測觀眾注意力分布,并給出參與度、廣告回憶度等KPI評分。

平臺服務(wù)于廣告代理商和品牌營銷團隊,解決"創(chuàng)意是否有效"的痛點,減少反復(fù)修改。

與訪談類平臺收集用戶"說"什么不同,Neurons測量用戶"看"什么,預(yù)測下意識反應(yīng)。其核心價值是數(shù)據(jù)驅(qū)動創(chuàng)意決策,在投放前識別最佳素材,降低風險,提升ROI。

⑤AI用戶研究平臺Synthetic

Synthetic核心是通過模擬訪談收集產(chǎn)品反饋。其技術(shù)基于多智能體系統(tǒng),調(diào)用GPT、LLaMA、Mistral等模型,每個合成用戶采用五因素人格模型(FFM),模擬認知偏差與行為模式,在和真人對話中調(diào)整信任度與語氣。

平臺支持企業(yè)上傳歷史訪談、客服工單等專有數(shù)據(jù)來定制合成真實的用戶背景。

其客戶主要來自制藥、汽車、消費品等行業(yè),平臺通過SOC 2認證并提供API接口。某藥企案例顯示,專家訪談周期從3個月縮短至數(shù)小時。平臺公開披露其合成結(jié)果與真實用戶洞察匹配度約為85-92%。

(2)合成數(shù)據(jù)公司

第二類公司則專注于技術(shù)“后臺”,即數(shù)據(jù)本身。壁壘在于數(shù)據(jù)保真度、隱私合規(guī)與系統(tǒng)集成,負責為上層模型和傳統(tǒng)分析提供安全、優(yōu)質(zhì)的“燃料”。

①開發(fā)者友好的合成數(shù)據(jù)API平臺Gretel Labs

Gretel Labs核心亮點是即時生成與隱私保證。它提供面向工程師的SDK和API,可在現(xiàn)有數(shù)據(jù)管道中無縫嵌入,幾行代碼即可生成高保真合成數(shù)據(jù)。其自定義生成式AI模型能合成文本、時序數(shù)據(jù),可跨表關(guān)系保持完整性,適合金融交易、醫(yī)療記錄等復(fù)雜場景。

Gretel服務(wù)Techstars、HelloFresh等科技公司,滿足開發(fā)測試、數(shù)據(jù)共享等高頻需求,其壁壘在于低摩擦集成和模型泛化能力,而非復(fù)雜的UI或咨詢服務(wù)。

②企業(yè)級合成數(shù)據(jù)平臺Tonic.ai

Tonic.ai專注為財富500強提供生產(chǎn)數(shù)據(jù)"去敏化"方案。其差異化在于數(shù)據(jù)庫子集化與關(guān)系保真:能從PB級生產(chǎn)數(shù)據(jù)庫抽取代表性子集,同時保持跨表外鍵關(guān)聯(lián)、時間戳邏輯和業(yè)務(wù)流程完整性,這對測試復(fù)雜企業(yè)系統(tǒng)(ERP、CRM)不可或缺。

技術(shù)上采用結(jié)構(gòu)感知生成,先解析數(shù)據(jù)庫Schema,再逐表訓練生成模型,確保合成數(shù)據(jù)在結(jié)構(gòu)上與原系統(tǒng)100%兼容。其客戶覆蓋Adobe、eBay等,核心價值是合規(guī)替代傳統(tǒng)數(shù)據(jù)脫敏,避免掩碼、加密導致的測試覆蓋率不足。

③數(shù)據(jù)隱私與分析增強平臺YData

YData的獨特之處在于合成數(shù)據(jù)與數(shù)據(jù)質(zhì)量閉環(huán)。它不僅生成數(shù)據(jù),更前置診斷數(shù)據(jù)缺陷(缺失值、偏差、不平衡),再針對性合成補充樣本,提升模型訓練效果。

它的Fabric平臺覆蓋從數(shù)據(jù)標注、生成到模型訓練的全流程,尤其適合自動駕駛、金融風控等對數(shù)據(jù)質(zhì)量敏感的領(lǐng)域。

與多數(shù)主打隱私保護的合成數(shù)據(jù)工具不同,YData強調(diào)自己是一個“AI開發(fā)加速器”,其合成數(shù)據(jù)不只“看起來像”真實數(shù)據(jù),更追求讓下游AI學得更好、預(yù)測更準。

無論是“前臺”還是“后臺”,他們共同指向一個轉(zhuǎn)變:市場研究正從依賴“有限樣本”的被動收集,邁向運用“無限模擬”的主動預(yù)測。一個由AI驅(qū)動、速度與深度并重的新研究時代已是歷史趨勢。

文/朗朗

       原文標題 : 誤差不到400票!16歲CTO帶隊,用5000個AI押中了美國選舉

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號