123,123

AI在這場戰(zhàn)爭中到底發(fā)揮了什么作用？冷靜地審視一下

2026-03-03 13:50

以美國和以色列為一方、以伊朗為另一方的又一次海灣軍事沖突，才開打兩天，就引發(fā)了一波關(guān)于“AI大模型在戰(zhàn)爭中的應(yīng)用”的大討論。僅以中文互聯(lián)網(wǎng)而言，3月1日市面上出現(xiàn)了一大批文章，信誓旦旦地宣稱“美國在打擊中使用了Claude以及Grok”，乃至“AI大模型發(fā)揮了不可或缺的作用”；很快又有人辟謠稱，AI的意義被嚴重高估了，美國“斬首行動”的成功并不依賴AI。那么到底哪一方更接近真相呢？

公允的說，關(guān)于“美國依靠AI打仗”的說法，有大量英文原始資料，不是國內(nèi)自媒體寫的小作文。但是具體來源比較駁雜，主要分為三大類：

1.宣稱AI大模型尤其是Claude在美國“斬首行動”中發(fā)揮了重要的情報分析作用，主要來源是《華爾街日報》的長篇文章，《衛(wèi)報》及路透等亦有報道。

2.宣稱Grok大模型成功預測了美國將于2月28日動手，這確實是事實，但其意義被嚴重夸大，并被進一步誤傳為“美國依靠Grok搞情報”。

3.宣稱AI對于美國戰(zhàn)爭機器而言已經(jīng)“不可或缺”，乃至把無人機的自動導航也歸類為AI，這主要是Reddit等英文社交媒體的夸大其詞。

先說第二條：截止目前，沒有證據(jù)顯示xAI出品的Grok大模型被用于美軍的情報分析和定位工作。在戰(zhàn)爭開始前，美國白宮指示國防部門禁用Claude, 但還沒來得及執(zhí)行就開打了。xAI試圖與美軍“簽約”替代Anthropic是很晚的事情，不可能在大戰(zhàn)一觸即發(fā)時替代。我們幾乎可以肯定，美軍在這次打擊過程中使用的大模型主要是Claude.

那么關(guān)于Grok的神話是怎么來的呢？2月25日，有人在網(wǎng)上貼出了對GPT, Gemini, Claude以及Grok這四大模型的問答記錄——喂給它們公開信息，采用假設(shè)性、誘導性的提示詞，詢問它們“美國或以色列計劃什么時候動手”。其他三個大模型回答都很寬泛，只有Grok給出了一個具體的時間：2月28日。后來這個日期被證明為真，Grok就此“封神”。

這說明Grok可能確實具備較強的公開信息整合能力，又或許它更傾向于給出一個具體的答案（并且恰好碰對了）。不管怎么說，“預測正確”與“被美軍使用”是兩碼事，任何人都可以使用Grok預測下一場戰(zhàn)爭的時間地點。附帶說一句，我個人認為，GPT和Claude拒絕回答具體日期，可能是“對齊機制”的結(jié)果，眾所周知這兩個模型政治正確過度，經(jīng)常不樂意回答它們認為有風險的話題。

再說第三條：毫無疑問，美軍（以及以色列軍）的軍隊部署、飛機起飛、導彈發(fā)射……等行為，全部是人為決策、人為執(zhí)行的。Claude也好，其他大模型也好，均未介入美軍指揮鏈條的決策行為（僅僅是提供建議），更沒有指揮武器系統(tǒng)啟動或發(fā)射。從常識想也知道，真正“定點清除”一個目標是要負政治責任的，這種事情哪能交給AI去做？哪怕今后AI真的具備了獨立的判斷力，最后背鍋的這個步驟恐怕還是得由人來做。何況目前AI大模型尚未融入任何武器系統(tǒng)本身。

還有人把美以聯(lián)軍“出動有史以來最先進的無人機群”（注：存疑）、進行自動轟炸，也視為“AI介入戰(zhàn)爭”的證據(jù)——這就是純粹的不學無術(shù)了。我們現(xiàn)在講的AI，是指生成式AI (Generative AI)，即以自然語言處理(NPL)為基礎(chǔ)、以Transformer架構(gòu)為底層技術(shù)的一種AI解決方案；我們現(xiàn)在討論的，是生成式AI對戰(zhàn)爭流程的介入究竟有多深。如果我們把所有自動化或智能化解決方案，都套上AI的概念，那我們會驚異地發(fā)現(xiàn)：當代飛機的火控系統(tǒng)是計算機控制的，甚至整個巡航過程都是計算機控制的，“發(fā)射后不管”的導彈也是計算機控制的……那人類戰(zhàn)爭豈不早就被AI接管了，還等得到今天？

在硅谷大廠的財報當中，會特別分清Gen AI和Core AI（傳統(tǒng)AI）的區(qū)別：推薦算法、搜索算法、內(nèi)容審核這些早已成熟的AI技術(shù)，被歸為Core AI，它們當然也會在一定程度上受到Gen AI的影響，但二者不能混為一談。否則，當我們看到長途民航客機除了起飛和降落階段，幾乎不需要人工干預時，豈不要贊嘆“AI威武，把飛行員搞得沒活干了”——可惜這個贊嘆晚了整整三十年，只能顯得我們沒見過世面……（附帶說一句，民航的計算機飛行控制系統(tǒng)甚至連Core AI都不算，這是另一個話題了。）

接下來說第一條，也是可信度最高的那一條：根據(jù)《華爾街日報》(WSJ)報道，以及多家權(quán)威英文媒體印證，Claude確實在美軍中央司令部(CENTCOM)的情報系統(tǒng)中發(fā)揮了不可或缺的作用，主要包括：情報整理，目標識別與選擇，戰(zhàn)場模擬，等等。人類在這個過程中仍然是主導者，負責提供信息、告知軍事行動目的，以及從AI提供的備選項之中進行選擇并最終下定決心。雖然在戰(zhàn)爭開始前，白宮宣布禁用Claude，但是考慮到它早已與五角大樓的情報系統(tǒng)深度綁定，此時禁用根本不現(xiàn)實，今后能不能實現(xiàn)禁用也很不好說。

請注意：沒有任何一家英文媒體宣稱Claude對伊朗高層進行了準確定位。對他們的成功定位是CIA情報人員長達數(shù)月工作的結(jié)果，Claude可能對這些情報進行了整理鑒定，但它既不負責獲取情報，也不負責最終定位。此外，關(guān)于Palantir發(fā)揮了重要作用的報道，基本也不出自嚴肅媒體，而來自Reddit等社交媒體。目前尚未有任何證據(jù)顯示Palantir發(fā)揮了作用；就算發(fā)揮了，估計也是外圍的、間接的作用。

所謂“Claude通過對各種蛛絲馬跡的分析，成功定位了伊朗高層，并與Palantir共同形成了一套殺戮鏈條(Kill Chain)”的說法，不是國內(nèi)自媒體寫的地攤文學，而是美國網(wǎng)友寫的地攤文學被轉(zhuǎn)譯到了國內(nèi)（并且又夸大了好幾倍）。然后這些地攤文學被統(tǒng)一加上“WSJ報道”或“《衛(wèi)報》報道”的標簽，這就純粹是欺負大多數(shù)人沒訂閱WSJ電子版，看不到原文了……

然而，我們可不可以下結(jié)論說，Claude發(fā)揮的作用可有可無，根本沒有改變戰(zhàn)爭形態(tài)呢？那就是從一個極端走向另一個極端了。假如AI真的可有可無，五角大樓為什么要把Claude深度融入其情報系統(tǒng)？白宮又為什么高度關(guān)注Claude的安全性？事實上，AI大模型在情報工作中最大的功能，就是“化繁為簡”，通過紛繁復雜、千頭萬緒的情報，找出“可能有用”的線索和范式。

只要是做過情報工作或研究工作的人就知道，現(xiàn)實中最大的問題不是情報太少，而是情報太多！就拿二戰(zhàn)期間最大的情報災(zāi)難——巴巴羅薩計劃來說，斯大林完全沒有料到自己會被希特勒背刺，是因為他沒拿到情報嗎？不，他拿到了太多自相矛盾的情報，同時他又忽視了希特勒不是一個正常人。無獨有偶，等到諾曼底登陸前夕，又輪到希特勒在海量情報面前束手無策了——盟軍成功進行了大規(guī)模欺騙，以大量錯誤的情報掩蓋了唯一的真相。類似的例子我們還能舉出很多很多。

Claude對海量、多模態(tài)情報，包括文字信息、衛(wèi)星圖片、信號情報(SIGINT)以及截獲通信內(nèi)容進行分析，其功勞確實很大，不過這份功勞得分成兩個維度：

對復雜多模態(tài)信息的識別、破譯、整合，比如從衛(wèi)星圖片中提取出有效信息，對語音信息進行降噪識別，以及對海量文字信息進行總結(jié)……這些工作沒有脫離傳統(tǒng)工具的范圍。與人工識別或傳統(tǒng)計算機識別相比，AI識別主要是提升了效率，并未提供什么“前所未有的東西”。

基于原始信息或已經(jīng)整理好的信息進行分析，發(fā)現(xiàn)某種“線索”(clue)或“范式”(pattern)，乃至提供具備可操作性的建議，這才是真正的降維打擊！比如說，喂給Claude一大堆公開新聞和內(nèi)部情報，它能不能發(fā)現(xiàn)無人注意到的重要盲點？并且解釋給情報人員聽？

遺憾的是，這一次Claude的作用多大程度上屬于前者、多大程度上屬于后者，還是個未知數(shù)。從常理推斷，哪怕它能做到獨立發(fā)現(xiàn)線索，情報人員恐怕也不會輕信，仍然會結(jié)合個人判斷反復驗證之后得出結(jié)論。WSJ的報道提到Claude幫助分析了伊朗高層人員的“行為模式”(pattern)并給出了建議，但這些建議到底有多詳細呢？事后證明是否正確？這一點，WSJ沒有明確的信源，恐怕哪家媒體都沒有。

講個有趣的事情：我剛才跟GPT, Gemini以及Grok分別討論了“AI大模型在美國軍事行動中發(fā)揮了什么作用”，其中Gemini最為激進，宣稱“AI對美軍已經(jīng)不可或缺”，“如果沒有AI，美軍打擊不可能成功”（但提供的證據(jù)十分薄弱）；GPT相對保守，表示AI有一定作用，但與大家想象的“全自動殺戮機器”完全不是一回事；Grok最為膽小，首先用很大篇幅解釋“Grok并未參與美軍情報系統(tǒng)”，然后對大模型在軍事中的應(yīng)用給出了非常保守的分析。不過三家的回答均有一定道理，旁征博引，讓我順藤摸瓜獲得了許多原始鏈接。

目前Grok是我最喜歡使用、聊天頻率最高的大模型。上個月是Gemini，此前兩年多的時間則一直是GPT。Grok 4.20 Beta的4 Agents模式讓我尤其喜愛，適合分析高度復雜的長文本。這說明大模型的進步還遠遠沒有到頭，哪怕是在文生文聊天這個十分成熟的賽道上，大家仍能各顯神通。我迫不及待看到接下來大家還能玩出什么花樣，好激動！

原文標題 : AI在這場戰(zhàn)爭中到底發(fā)揮了什么作用？冷靜地審視一下