123,123

誤差不到400票！16歲CTO帶隊(duì)，用5000個(gè)AI押中了美國(guó)選舉

2025-12-16 15:24

不找人聊，就能知道人在想什么？一群00后正在用AI改寫調(diào)研行業(yè)。

2024年，一群平均年齡18歲的年輕人用約5000次AI對(duì)話（每次僅需30-90秒），便以接近零的成本，成功預(yù)測(cè)了美國(guó)紐約州民主黨初選的結(jié)果，票數(shù)誤差不到400張。

不到兩年，這群年輕人所創(chuàng)立的AI調(diào)研公司Aaru，已拿下埃森哲、安永和IPG等頂級(jí)合作伙伴，并在2025年底以10億美元估值完成5000美元A輪融資。

這一切的背后，是一個(gè)簡(jiǎn)單到近乎狂妄的理念——用“無限模擬”取代“有限樣本”。

Aaru的核心不是讓AI變得更會(huì)“問問題”，而是讓AI學(xué)會(huì)“當(dāng)人”。他們訓(xùn)練了成千上萬個(gè)AI智能體，每個(gè)都被賦予復(fù)雜的人口屬性和行為認(rèn)知模式，像一個(gè)微縮版的真人。

當(dāng)這些“合成人”在數(shù)字世界里相互作用，就能回答以前無法回答的問題，如人群面對(duì)新產(chǎn)品、新政策或新廣告時(shí)的集體反應(yīng)。

Aaru所代表的“合成行為”處于技術(shù)棧頂層，它正與其他“合成互動(dòng)”（如Keplar、Outset）與“合成數(shù)據(jù)”（如Gretel、YData）的探索者，重塑價(jià)值800億美金的調(diào)研市場(chǎng)。

/ 01 /

當(dāng)AI Agents像人一樣思考

當(dāng)市面上大多數(shù)AI競(jìng)爭(zhēng)者還在圍繞“如何更高效地收集人的洞察”展開角逐時(shí)，Aaru的思路有點(diǎn)不一樣：如果不依賴真實(shí)的人，而是直接“合成”出無限個(gè)能模擬人類行為的數(shù)字智能體，來預(yù)測(cè)群體反應(yīng)呢？

他們的核心叫做“仿真預(yù)測(cè)”，“建模-模擬-預(yù)測(cè)”，主打一個(gè)“如果……會(huì)怎樣？”的動(dòng)態(tài)推演。

技術(shù)路徑是訓(xùn)練出大量AI Agents（多智能體系統(tǒng)，MAS），這些Agent依賴于多個(gè)來源的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)，如社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)、消費(fèi)者行為數(shù)據(jù)、社交媒體情緒信號(hào)等。

每個(gè)智能體不僅攜帶年齡、收入等標(biāo)簽，更被賦予了行為模式、決策動(dòng)機(jī)甚至認(rèn)知偏好，相當(dāng)于一個(gè)個(gè)“仿真用戶”。

把這些智能體組合起來，就形成了一個(gè)動(dòng)態(tài)、可交互的人類行為知識(shí)庫。換句話說，這不止是合成數(shù)據(jù)，它直接合成了人。

比如，Aaru訓(xùn)練出特定人群標(biāo)簽如“25-30歲一線城市白領(lǐng)”后，會(huì)模擬其決策邏輯，例如面對(duì)企業(yè)新產(chǎn)品時(shí)是否購買、面對(duì)公共事件時(shí)的態(tài)度傾向等。

這些“合成人”能做什么？

Aaru找到了一個(gè)極致展現(xiàn)自身優(yōu)勢(shì)的“燈塔場(chǎng)景”——政治選舉預(yù)測(cè)。

他們用約5000次AI問答（每次僅需30-90秒），成功預(yù)測(cè)了2024年美國(guó)紐約州民主黨初選的結(jié)果，與實(shí)際票數(shù)相差不足371票，而成本據(jù)稱只有傳統(tǒng)民調(diào)的1/10。

如果交給傳統(tǒng)市場(chǎng)調(diào)研，可能耗時(shí)數(shù)周、花費(fèi)數(shù)十萬美元。

這個(gè)場(chǎng)景具有結(jié)果公開、驗(yàn)證周期短、勝負(fù)分明的特點(diǎn)，其成功預(yù)測(cè)且成本極低，成為了其技術(shù)能力的“鐵證”。

Aaru的準(zhǔn)確率也得到了認(rèn)可。IPG（洲際傳播集團(tuán)）的首席解決方案官評(píng)價(jià)，Aaru的準(zhǔn)確度“高于任何網(wǎng)站調(diào)查、民調(diào)或焦點(diǎn)小組”。

除了政治選舉，Aaru的應(yīng)用還伸展到企業(yè)決策和公共策略等領(lǐng)域。項(xiàng)目規(guī)模也能彈性縮放，從幾個(gè)智能體的小測(cè)試到十萬量級(jí)的大規(guī)模模擬都能支持。

目前，Aaru的產(chǎn)品主要分為三塊：

①Lumen，面向企業(yè)決策模擬。它能模擬企業(yè)高管、高凈值客戶等難以觸達(dá)的群體，用于產(chǎn)品概念測(cè)試、超定向營(yíng)銷策略驗(yàn)證等。目標(biāo)受眾如“每年消費(fèi)3萬美元購買手袋的人群”，“農(nóng)村市場(chǎng)中患有糖尿病的新手父母”。

②Dynamo模擬人性，專注于選舉預(yù)測(cè)。通過讓大量智能體持續(xù)接收并處理信息，模擬選民接觸媒體并更新觀點(diǎn)）。在政治選舉場(chǎng)景中，每個(gè)AI智能體會(huì)持續(xù)接收信息，模擬真實(shí)選民如何獲取媒體內(nèi)容并更新觀點(diǎn)，從而替代傳統(tǒng)民調(diào)來預(yù)測(cè)選舉結(jié)果。

③Seraph，則為公共部門設(shè)計(jì)，其支持配置任意時(shí)間、地點(diǎn)和媒介環(huán)境，用于在動(dòng)態(tài)環(huán)境中模擬輿情與信息傳播，以輔助高風(fēng)險(xiǎn)決策。

目前，Aaru已經(jīng)與IPG合作成立了“模擬工作室”（Simulation Studio）。

簡(jiǎn)單來說，IPG將把Aaru的“人群模擬”能力，接入自家的消費(fèi)者數(shù)據(jù)平臺(tái)Acxiom。這意味著，在合法合規(guī)使用數(shù)據(jù)的前提下，模擬出的人群畫像將更精細(xì)、更貼近現(xiàn)實(shí)，從而幫助品牌進(jìn)行細(xì)分和市場(chǎng)觸達(dá)。

值得一提的是，推動(dòng)這套設(shè)想落地的，是一個(gè)平均年齡僅18歲的年輕團(tuán)隊(duì)，其中公司的CTO更是只有16歲。

Cam Fink，20歲，聯(lián)合創(chuàng)始人&CEO，有Kleiner Perkins、RSI等機(jī)構(gòu)工作/研究經(jīng)歷；

Ned Koh，20歲，聯(lián)合創(chuàng)始人，曾就讀于哈佛大學(xué)，有西北大學(xué)研究、創(chuàng)企聯(lián)創(chuàng)的經(jīng)歷；

John Kessler，16歲，聯(lián)合創(chuàng)始人&CTO。

數(shù)據(jù)是新的黃金。Aaru正用一套近乎科幻的方法，嘗試撬動(dòng)依賴經(jīng)驗(yàn)和樣本的傳統(tǒng)調(diào)研行業(yè)，巨頭們的入場(chǎng)與合作，已經(jīng)是一個(gè)不容忽視的信號(hào)。

/ 02 /

用“無限模擬”，取代“有限樣本”

800億美金調(diào)研市場(chǎng)背后的勞動(dòng)力體量龐大，傳統(tǒng)模式的核心是“抽樣-詢問-統(tǒng)計(jì)”，其瓶頸在于樣本的有限性、成本的高昂與反饋的滯后。

AI正以兩種路徑重塑這個(gè)行業(yè)：

（1）訪談增強(qiáng)類

第一類公司聚焦于研究流程的“前臺(tái)”，用AI模擬互動(dòng)過程（訪談），但仍與真人交互。

壁壘在于自然交互技術(shù)和流程自動(dòng)化，通過規(guī)模化獲取定性洞察，捕捉語氣、表情等非語言線索，試圖獲取更深層的情感與行為洞察。

①AI語音訪談?wù){(diào)研Keplar

Keplar是一款A(yù)I語音訪談平臺(tái)，用語音AI替代傳統(tǒng)人工訪談。其亮點(diǎn)在于多模態(tài)對(duì)話真實(shí)性：AI主持人能以"Ellie""Andrew"等擬人化身份進(jìn)行語音訪談，參與者常忘記對(duì)方是AI，對(duì)話錄音中甚至能聽到直呼AI名字的自然互動(dòng)。

它將任意產(chǎn)品問題轉(zhuǎn)化為訪談指南，直接調(diào)取CRM客戶名單并發(fā)數(shù)百通語音訪談，實(shí)時(shí)分析回答主題。

與傳統(tǒng)調(diào)研公司相比，將訪談周期從數(shù)周壓縮至數(shù)小時(shí)，成本降至幾十分之一。差異化在于語音優(yōu)先，通過語音語調(diào)、停頓節(jié)奏建立信任，獲取更深層的情感化反饋，其交付物是可直接用于匯報(bào)的PPT和報(bào)告，而非原始數(shù)據(jù)。

②視頻深度訪談Listen Labs

Listen Labs是紅杉資本重注的AI用戶研究平臺(tái)，累計(jì)融資2700萬美元。其獨(dú)特之處在于視頻訪談的深度與規(guī)模平衡：AI主持人可進(jìn)行視頻訪談，參與者通過視頻、語音、文字或屏幕共享回應(yīng)，還原了面對(duì)面訪談的豐富度。

核心差異是視頻+AI分析的組合。平臺(tái)強(qiáng)調(diào)"定量規(guī)模的定性深度"，能同時(shí)執(zhí)行數(shù)百個(gè)視頻訪談，AI自動(dòng)編碼回答、識(shí)別主題并生成報(bào)告。

Listen Labs捕捉視覺線索，如表情、操作行為、環(huán)境背景，更適合UX研究和產(chǎn)品測(cè)試。其客戶覆蓋消費(fèi)品、醫(yī)療等大型企業(yè)。

③AI主持人訪談Outset

Outset專注AI主導(dǎo)的深度訪談，總?cè)谫Y2100萬美元，由8VC領(lǐng)投、貝恩資本參與。其平臺(tái)讓AI主持人通過視頻/語音與數(shù)千名參與者對(duì)話，自動(dòng)合成結(jié)果。

核心亮點(diǎn)是超大規(guī)模與速度：25個(gè)深度訪談傳統(tǒng)需4-6周，Outset可在1周內(nèi)完成250個(gè)訪談并自動(dòng)分析，速度提8倍、成本降81%倍。

差異化在于全研究流程自動(dòng)化，從創(chuàng)建討論指南、招募受訪者到分析結(jié)果、生成報(bào)告，研究團(tuán)隊(duì)只需輸入研究問題，平臺(tái)自動(dòng)處理其余環(huán)節(jié)。

客戶包括雀巢、微軟、慧儷輕體等500強(qiáng)企業(yè)。與Listen Labs相比，Outset更強(qiáng)調(diào)端到端自動(dòng)化和企業(yè)級(jí)集成能力，適合需要快速、大規(guī)模獲取客戶"為什么"的復(fù)雜研究項(xiàng)目。

④神經(jīng)營(yíng)銷AI平臺(tái)Neurons

Neurons專注廣告和創(chuàng)意效果預(yù)測(cè)，基于認(rèn)知神經(jīng)科學(xué)、機(jī)器學(xué)習(xí)與心理學(xué)構(gòu)建。其亮點(diǎn)是秒級(jí)注意力預(yù)測(cè)：上傳廣告素材，AI在數(shù)秒內(nèi)生成熱力圖，預(yù)測(cè)觀眾注意力分布，并給出參與度、廣告回憶度等KPI評(píng)分。

平臺(tái)服務(wù)于廣告代理商和品牌營(yíng)銷團(tuán)隊(duì)，解決"創(chuàng)意是否有效"的痛點(diǎn)，減少反復(fù)修改。

與訪談?lì)惼脚_(tái)收集用戶"說"什么不同，Neurons測(cè)量用戶"看"什么，預(yù)測(cè)下意識(shí)反應(yīng)。其核心價(jià)值是數(shù)據(jù)驅(qū)動(dòng)創(chuàng)意決策，在投放前識(shí)別最佳素材，降低風(fēng)險(xiǎn)，提升ROI。

⑤AI用戶研究平臺(tái)Synthetic

Synthetic核心是通過模擬訪談收集產(chǎn)品反饋。其技術(shù)基于多智能體系統(tǒng)，調(diào)用GPT、LLaMA、Mistral等模型，每個(gè)合成用戶采用五因素人格模型（FFM），模擬認(rèn)知偏差與行為模式，在和真人對(duì)話中調(diào)整信任度與語氣。

平臺(tái)支持企業(yè)上傳歷史訪談、客服工單等專有數(shù)據(jù)來定制合成真實(shí)的用戶背景。

其客戶主要來自制藥、汽車、消費(fèi)品等行業(yè)，平臺(tái)通過SOC 2認(rèn)證并提供API接口。某藥企案例顯示，專家訪談周期從3個(gè)月縮短至數(shù)小時(shí)。平臺(tái)公開披露其合成結(jié)果與真實(shí)用戶洞察匹配度約為85-92%。

（2）合成數(shù)據(jù)公司

第二類公司則專注于技術(shù)“后臺(tái)”，即數(shù)據(jù)本身。壁壘在于數(shù)據(jù)保真度、隱私合規(guī)與系統(tǒng)集成，負(fù)責(zé)為上層模型和傳統(tǒng)分析提供安全、優(yōu)質(zhì)的“燃料”。

①開發(fā)者友好的合成數(shù)據(jù)API平臺(tái)Gretel Labs

Gretel Labs核心亮點(diǎn)是即時(shí)生成與隱私保證。它提供面向工程師的SDK和API，可在現(xiàn)有數(shù)據(jù)管道中無縫嵌入，幾行代碼即可生成高保真合成數(shù)據(jù)。其自定義生成式AI模型能合成文本、時(shí)序數(shù)據(jù)，可跨表關(guān)系保持完整性，適合金融交易、醫(yī)療記錄等復(fù)雜場(chǎng)景。

Gretel服務(wù)Techstars、HelloFresh等科技公司，滿足開發(fā)測(cè)試、數(shù)據(jù)共享等高頻需求，其壁壘在于低摩擦集成和模型泛化能力，而非復(fù)雜的UI或咨詢服務(wù)。

②企業(yè)級(jí)合成數(shù)據(jù)平臺(tái)Tonic.ai

Tonic.ai專注為財(cái)富500強(qiáng)提供生產(chǎn)數(shù)據(jù)"去敏化"方案。其差異化在于數(shù)據(jù)庫子集化與關(guān)系保真：能從PB級(jí)生產(chǎn)數(shù)據(jù)庫抽取代表性子集，同時(shí)保持跨表外鍵關(guān)聯(lián)、時(shí)間戳邏輯和業(yè)務(wù)流程完整性，這對(duì)測(cè)試復(fù)雜企業(yè)系統(tǒng)（ERP、CRM）不可或缺。

技術(shù)上采用結(jié)構(gòu)感知生成，先解析數(shù)據(jù)庫Schema，再逐表訓(xùn)練生成模型，確保合成數(shù)據(jù)在結(jié)構(gòu)上與原系統(tǒng)100%兼容。其客戶覆蓋Adobe、eBay等，核心價(jià)值是合規(guī)替代傳統(tǒng)數(shù)據(jù)脫敏，避免掩碼、加密導(dǎo)致的測(cè)試覆蓋率不足。

③數(shù)據(jù)隱私與分析增強(qiáng)平臺(tái)YData

YData的獨(dú)特之處在于合成數(shù)據(jù)與數(shù)據(jù)質(zhì)量閉環(huán)。它不僅生成數(shù)據(jù)，更前置診斷數(shù)據(jù)缺陷（缺失值、偏差、不平衡），再針對(duì)性合成補(bǔ)充樣本，提升模型訓(xùn)練效果。

它的Fabric平臺(tái)覆蓋從數(shù)據(jù)標(biāo)注、生成到模型訓(xùn)練的全流程，尤其適合自動(dòng)駕駛、金融風(fēng)控等對(duì)數(shù)據(jù)質(zhì)量敏感的領(lǐng)域。

與多數(shù)主打隱私保護(hù)的合成數(shù)據(jù)工具不同，YData強(qiáng)調(diào)自己是一個(gè)“AI開發(fā)加速器”，其合成數(shù)據(jù)不只“看起來像”真實(shí)數(shù)據(jù)，更追求讓下游AI學(xué)得更好、預(yù)測(cè)更準(zhǔn)。

無論是“前臺(tái)”還是“后臺(tái)”，他們共同指向一個(gè)轉(zhuǎn)變：市場(chǎng)研究正從依賴“有限樣本”的被動(dòng)收集，邁向運(yùn)用“無限模擬”的主動(dòng)預(yù)測(cè)。一個(gè)由AI驅(qū)動(dòng)、速度與深度并重的新研究時(shí)代已是歷史趨勢(shì)。

文/朗朗

原文標(biāo)題 : 誤差不到400票！16歲CTO帶隊(duì)，用5000個(gè)AI押中了美國(guó)選舉