訂閱
糾錯
加入自媒體

AI在這場戰(zhàn)爭中到底發(fā)揮了什么作用?冷靜地審視一下

以美國和以色列為一方、以伊朗為另一方的又一次海灣軍事沖突,才開打兩天,就引發(fā)了一波關(guān)于“AI大模型在戰(zhàn)爭中的應(yīng)用”的大討論。僅以中文互聯(lián)網(wǎng)而言,3月1日市面上出現(xiàn)了一大批文章,信誓旦旦地宣稱“美國在打擊中使用了Claude以及Grok”,乃至“AI大模型發(fā)揮了不可或缺的作用”;很快又有人辟謠稱,AI的意義被嚴重高估了,美國“斬首行動”的成功并不依賴AI。那么到底哪一方更接近真相呢?

公允的說,關(guān)于“美國依靠AI打仗”的說法,有大量英文原始資料,不是國內(nèi)自媒體寫的小作文。但是具體來源比較駁雜,主要分為三大類:

1.宣稱AI大模型尤其是Claude在美國“斬首行動”中發(fā)揮了重要的情報分析作用,主要來源是《華爾街日報》的長篇文章,《衛(wèi)報》及路透等亦有報道。

2.宣稱Grok大模型成功預測了美國將于2月28日動手,這確實是事實,但其意義被嚴重夸大,并被進一步誤傳為“美國依靠Grok搞情報”。

3.宣稱AI對于美國戰(zhàn)爭機器而言已經(jīng)“不可或缺”,乃至把無人機的自動導航也歸類為AI,這主要是Reddit等英文社交媒體的夸大其詞。

先說第二條:截止目前,沒有證據(jù)顯示xAI出品的Grok大模型被用于美軍的情報分析和定位工作。在戰(zhàn)爭開始前,美國白宮指示國防部門禁用Claude, 但還沒來得及執(zhí)行就開打了。xAI試圖與美軍“簽約”替代Anthropic是很晚的事情,不可能在大戰(zhàn)一觸即發(fā)時替代。我們幾乎可以肯定,美軍在這次打擊過程中使用的大模型主要是Claude.

那么關(guān)于Grok的神話是怎么來的呢?2月25日,有人在網(wǎng)上貼出了對GPT, Gemini, Claude以及Grok這四大模型的問答記錄——喂給它們公開信息,采用假設(shè)性、誘導性的提示詞,詢問它們“美國或以色列計劃什么時候動手”。其他三個大模型回答都很寬泛,只有Grok給出了一個具體的時間:2月28日。后來這個日期被證明為真,Grok就此“封神”。

這說明Grok可能確實具備較強的公開信息整合能力,又或許它更傾向于給出一個具體的答案(并且恰好碰對了)。不管怎么說,“預測正確”與“被美軍使用”是兩碼事,任何人都可以使用Grok預測下一場戰(zhàn)爭的時間地點。附帶說一句,我個人認為,GPT和Claude拒絕回答具體日期,可能是“對齊機制”的結(jié)果,眾所周知這兩個模型政治正確過度,經(jīng)常不樂意回答它們認為有風險的話題。

再說第三條:毫無疑問,美軍(以及以色列軍)的軍隊部署、飛機起飛、導彈發(fā)射……等行為,全部是人為決策、人為執(zhí)行的。Claude也好,其他大模型也好,均未介入美軍指揮鏈條的決策行為(僅僅是提供建議),更沒有指揮武器系統(tǒng)啟動或發(fā)射。從常識想也知道,真正“定點清除”一個目標是要負政治責任的,這種事情哪能交給AI去做?哪怕今后AI真的具備了獨立的判斷力,最后背鍋的這個步驟恐怕還是得由人來做。何況目前AI大模型尚未融入任何武器系統(tǒng)本身。

還有人把美以聯(lián)軍“出動有史以來最先進的無人機群”(注:存疑)、進行自動轟炸,也視為“AI介入戰(zhàn)爭”的證據(jù)——這就是純粹的不學無術(shù)了。我們現(xiàn)在講的AI,是指生成式AI (Generative AI),即以自然語言處理(NPL)為基礎(chǔ)、以Transformer架構(gòu)為底層技術(shù)的一種AI解決方案;我們現(xiàn)在討論的,是生成式AI對戰(zhàn)爭流程的介入究竟有多深。如果我們把所有自動化或智能化解決方案,都套上AI的概念,那我們會驚異地發(fā)現(xiàn):當代飛機的火控系統(tǒng)是計算機控制的,甚至整個巡航過程都是計算機控制的,“發(fā)射后不管”的導彈也是計算機控制的……那人類戰(zhàn)爭豈不早就被AI接管了,還等得到今天?

在硅谷大廠的財報當中,會特別分清Gen AI和Core AI(傳統(tǒng)AI)的區(qū)別:推薦算法、搜索算法、內(nèi)容審核這些早已成熟的AI技術(shù),被歸為Core AI,它們當然也會在一定程度上受到Gen AI的影響,但二者不能混為一談。否則,當我們看到長途民航客機除了起飛和降落階段,幾乎不需要人工干預時,豈不要贊嘆“AI威武,把飛行員搞得沒活干了”——可惜這個贊嘆晚了整整三十年,只能顯得我們沒見過世面……(附帶說一句,民航的計算機飛行控制系統(tǒng)甚至連Core AI都不算,這是另一個話題了。)

接下來說第一條,也是可信度最高的那一條:根據(jù)《華爾街日報》(WSJ)報道,以及多家權(quán)威英文媒體印證,Claude確實在美軍中央司令部(CENTCOM)的情報系統(tǒng)中發(fā)揮了不可或缺的作用,主要包括:情報整理,目標識別與選擇,戰(zhàn)場模擬,等等。人類在這個過程中仍然是主導者,負責提供信息、告知軍事行動目的,以及從AI提供的備選項之中進行選擇并最終下定決心。雖然在戰(zhàn)爭開始前,白宮宣布禁用Claude,但是考慮到它早已與五角大樓的情報系統(tǒng)深度綁定,此時禁用根本不現(xiàn)實,今后能不能實現(xiàn)禁用也很不好說。

請注意:沒有任何一家英文媒體宣稱Claude對伊朗高層進行了準確定位。對他們的成功定位是CIA情報人員長達數(shù)月工作的結(jié)果,Claude可能對這些情報進行了整理鑒定,但它既不負責獲取情報,也不負責最終定位。此外,關(guān)于Palantir發(fā)揮了重要作用的報道,基本也不出自嚴肅媒體,而來自Reddit等社交媒體。目前尚未有任何證據(jù)顯示Palantir發(fā)揮了作用;就算發(fā)揮了,估計也是外圍的、間接的作用。

所謂“Claude通過對各種蛛絲馬跡的分析,成功定位了伊朗高層,并與Palantir共同形成了一套殺戮鏈條(Kill Chain)”的說法,不是國內(nèi)自媒體寫的地攤文學,而是美國網(wǎng)友寫的地攤文學被轉(zhuǎn)譯到了國內(nèi)(并且又夸大了好幾倍)。然后這些地攤文學被統(tǒng)一加上“WSJ報道”或“《衛(wèi)報》報道”的標簽,這就純粹是欺負大多數(shù)人沒訂閱WSJ電子版,看不到原文了……

然而,我們可不可以下結(jié)論說,Claude發(fā)揮的作用可有可無,根本沒有改變戰(zhàn)爭形態(tài)呢?那就是從一個極端走向另一個極端了。假如AI真的可有可無,五角大樓為什么要把Claude深度融入其情報系統(tǒng)?白宮又為什么高度關(guān)注Claude的安全性?事實上,AI大模型在情報工作中最大的功能,就是“化繁為簡”,通過紛繁復雜、千頭萬緒的情報,找出“可能有用”的線索和范式。

只要是做過情報工作或研究工作的人就知道,現(xiàn)實中最大的問題不是情報太少,而是情報太多!就拿二戰(zhàn)期間最大的情報災(zāi)難——巴巴羅薩計劃來說,斯大林完全沒有料到自己會被希特勒背刺,是因為他沒拿到情報嗎?不,他拿到了太多自相矛盾的情報,同時他又忽視了希特勒不是一個正常人。無獨有偶,等到諾曼底登陸前夕,又輪到希特勒在海量情報面前束手無策了——盟軍成功進行了大規(guī)模欺騙,以大量錯誤的情報掩蓋了唯一的真相。類似的例子我們還能舉出很多很多。

Claude對海量、多模態(tài)情報,包括文字信息、衛(wèi)星圖片、信號情報(SIGINT)以及截獲通信內(nèi)容進行分析,其功勞確實很大,不過這份功勞得分成兩個維度:

對復雜多模態(tài)信息的識別、破譯、整合,比如從衛(wèi)星圖片中提取出有效信息,對語音信息進行降噪識別,以及對海量文字信息進行總結(jié)……這些工作沒有脫離傳統(tǒng)工具的范圍。與人工識別或傳統(tǒng)計算機識別相比,AI識別主要是提升了效率,并未提供什么“前所未有的東西”。

基于原始信息或已經(jīng)整理好的信息進行分析,發(fā)現(xiàn)某種“線索”(clue)或“范式”(pattern),乃至提供具備可操作性的建議,這才是真正的降維打擊!比如說,喂給Claude一大堆公開新聞和內(nèi)部情報,它能不能發(fā)現(xiàn)無人注意到的重要盲點?并且解釋給情報人員聽?

遺憾的是,這一次Claude的作用多大程度上屬于前者、多大程度上屬于后者,還是個未知數(shù)。從常理推斷,哪怕它能做到獨立發(fā)現(xiàn)線索,情報人員恐怕也不會輕信,仍然會結(jié)合個人判斷反復驗證之后得出結(jié)論。WSJ的報道提到Claude幫助分析了伊朗高層人員的“行為模式”(pattern)并給出了建議,但這些建議到底有多詳細呢?事后證明是否正確?這一點,WSJ沒有明確的信源,恐怕哪家媒體都沒有。

講個有趣的事情:我剛才跟GPT, Gemini以及Grok分別討論了“AI大模型在美國軍事行動中發(fā)揮了什么作用”,其中Gemini最為激進,宣稱“AI對美軍已經(jīng)不可或缺”,“如果沒有AI,美軍打擊不可能成功”(但提供的證據(jù)十分薄弱);GPT相對保守,表示AI有一定作用,但與大家想象的“全自動殺戮機器”完全不是一回事;Grok最為膽小,首先用很大篇幅解釋“Grok并未參與美軍情報系統(tǒng)”,然后對大模型在軍事中的應(yīng)用給出了非常保守的分析。不過三家的回答均有一定道理,旁征博引,讓我順藤摸瓜獲得了許多原始鏈接。

目前Grok是我最喜歡使用、聊天頻率最高的大模型。上個月是Gemini,此前兩年多的時間則一直是GPT。Grok 4.20 Beta的4 Agents模式讓我尤其喜愛,適合分析高度復雜的長文本。這說明大模型的進步還遠遠沒有到頭,哪怕是在文生文聊天這個十分成熟的賽道上,大家仍能各顯神通。我迫不及待看到接下來大家還能玩出什么花樣,好激動!

       原文標題 : AI在這場戰(zhàn)爭中到底發(fā)揮了什么作用?冷靜地審視一下

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號