123,123,123

大模型日?qǐng)?bào)| 文心、千問(wèn)躋身全球前列，Anthropic估值3500億美元

2026-01-09 14:28

硅基星芒

關(guān)注

重大發(fā)布（新模型/產(chǎn)品/開(kāi)源）

①馬斯克：新版Grok Imagine已發(fā)布

7日晚間，馬斯克發(fā)布推文稱(chēng)新版的視頻生成工具Grok Imagine已經(jīng)發(fā)布。

2d5a8ff8faca861a2bec4b97aadb333c

官方并未公開(kāi)此次更新的技術(shù)細(xì)節(jié)，因此推測(cè)是針對(duì)近期Grok遭到內(nèi)容生成相關(guān)指控的一次緊急更新。

根據(jù)實(shí)測(cè)反饋，此次更新后內(nèi)容審查機(jī)制明顯更加嚴(yán)格，部分原先可用的提示詞目前已被管控。該模型在單圖修改方面表現(xiàn)較為出色，但在多圖編輯、文生圖能力上仍有提升空間，尤其對(duì)中文的理解能力相對(duì)較弱。

短評(píng)：

在Grok頻繁遭到部分國(guó)家的審查后，馬斯克的這次更新大概率是不得已而為之，但Grok Imagine在多模態(tài)領(lǐng)域的地位本就有些不上不下，在模型能力沒(méi)有顯著提升的同時(shí)加強(qiáng)審查機(jī)制，后果只有用戶(hù)的流失和風(fēng)評(píng)的下降。

②國(guó)產(chǎn)之光：百度文心5.0登上LMArena視覺(jué)排行榜TOP10

1月7日，剛剛獲得1.5億美元融資的大模型競(jìng)技場(chǎng)平臺(tái)LMArena更新了大模型視覺(jué)理解榜單（Vision Arena）。

在這份常年由Gemini和GPT占據(jù)前十的榜單中，百度的ERNIE-5.0-preview-1220模型出其不意地出現(xiàn)在了第8位，這也是前十名中唯一的國(guó)產(chǎn)模型。

根據(jù)百度官方于2025年11月公布的數(shù)據(jù)，文心大模型5.0采用了超稀疏混合專(zhuān)家架構(gòu)，參數(shù)規(guī)模達(dá)到2.4萬(wàn)億，在全模態(tài)理解、創(chuàng)意協(xié)作、智能體規(guī)劃和指令遵循等方面均實(shí)現(xiàn)了顯著的能力提升。

目前，該榜單的前四名由Google占據(jù)，第5-7名則屬于OpenAI，除文心5.0外，下一個(gè)國(guó)產(chǎn)模型是阿里的Qwen3-VL-235B-A22B-Instruct位于第15位。

短評(píng)：

LMArena的視覺(jué)榜單幾乎被Google和OpenAI所統(tǒng)治，兩家全球頂級(jí)模型的能力也毋庸置疑，文心5.0能達(dá)到這個(gè)高度實(shí)屬不易。

但是，文心系列大模型在整體智能水平上不及阿里的通義千問(wèn)，在多模態(tài)能力方面也落后于字節(jié)的豆包，再加上其引以為傲的搜索引擎正在被Chatbot逐步替代，僅靠視覺(jué)能力的提升恐怕難以實(shí)現(xiàn)反制。

③OpenAI進(jìn)軍醫(yī)療領(lǐng)域：ChatGPT Health健康助手上線(xiàn)

1月7日，OpenAI正式推出全新的健康模式：ChatGPT Health，這一功能能夠?yàn)橛脩?hù)提供安全、隔離的私密空間，并完成電子病歷、Apple健康、MyFitnessPal等個(gè)人健康信息的整合。

簡(jiǎn)單來(lái)說(shuō)，它能夠在不侵犯用戶(hù)隱私權(quán)的同時(shí)，完成幫助用戶(hù)分析體檢結(jié)果、提供就診建議以及規(guī)劃飲食運(yùn)動(dòng)等常見(jiàn)需求。

e11009eb1f956bbb58934e13fbbcb1d4

該功能的重點(diǎn)在于隱私權(quán)的保護(hù)。OpenAI表示，健康相關(guān)對(duì)話(huà)將不會(huì)用于模型訓(xùn)練，用戶(hù)將擁有健康數(shù)據(jù)的完整控制權(quán)，隨時(shí)可以進(jìn)行查看和刪除。

根據(jù)OpenAI公布的數(shù)據(jù)，ChatGPT Health由OpenAI與全球60多個(gè)國(guó)家、超過(guò)260位執(zhí)業(yè)醫(yī)生合作開(kāi)發(fā)，訓(xùn)練過(guò)程中基于真實(shí)的臨床反饋對(duì)回復(fù)邏輯進(jìn)行優(yōu)化，并通過(guò)名為HealthBench的醫(yī)生主導(dǎo)評(píng)估框架確保生成內(nèi)容具備安全性與實(shí)用性。

目前，這一功能正在進(jìn)行小范圍測(cè)試，優(yōu)先向美國(guó)用戶(hù)開(kāi)放，支持b.well醫(yī)療平臺(tái)、Apple健康、Function、Weight Watchers、Peloton等服務(wù)。網(wǎng)頁(yè)端與iOS版本將在未來(lái)幾周逐步向所有用戶(hù)推出。

短評(píng)：

OpenAI這次進(jìn)入醫(yī)療領(lǐng)域，沒(méi)有選擇挑戰(zhàn)高風(fēng)險(xiǎn)的診療場(chǎng)景，而是選擇聚焦于日常健康管理這一低風(fēng)險(xiǎn)、高頻次的應(yīng)用場(chǎng)景。信息整合和決策支持相比需要大量專(zhuān)業(yè)知識(shí)支撐的臨床決策要更適合AI完成，在保持對(duì)醫(yī)學(xué)專(zhuān)業(yè)性的尊重的同時(shí)也有效規(guī)避了法律風(fēng)險(xiǎn)。

AI競(jìng)爭(zhēng)的下半場(chǎng)是應(yīng)用，ChatGPT Health這一新功能依靠生態(tài)合作，能夠獲取更準(zhǔn)確的用戶(hù)數(shù)據(jù)，再通過(guò)OpenAI強(qiáng)大的場(chǎng)景整合能力將AI直接融入用戶(hù)的生活，實(shí)現(xiàn)應(yīng)用價(jià)值的提升。不過(guò)，雖然應(yīng)用場(chǎng)景的實(shí)際需求已經(jīng)擺在眼前，但能否大規(guī)模落地，還要取決于數(shù)據(jù)連接的廣度和隱私保護(hù)的可信度。

02技術(shù)進(jìn)展（論文/SOTA/算法）

①開(kāi)源大模型格局：Qwen結(jié)束Llama統(tǒng)治，國(guó)產(chǎn)模型領(lǐng)跑2025

2025年，全球的開(kāi)源大模型生態(tài)迎來(lái)了重磅性的轉(zhuǎn)折：國(guó)產(chǎn)模型的整體使用率已經(jīng)超過(guò)美國(guó)和歐洲。與此同時(shí)，根據(jù)《The ATOM Project》公布的數(shù)據(jù)，阿里的通義千問(wèn)（Qwen）系列模型已經(jīng)取代了Meta的Llama系列模型，成為全球開(kāi)發(fā)者默認(rèn)首選的開(kāi)源基礎(chǔ)模型，廣泛應(yīng)用于本地部署、推理任務(wù)和多模態(tài)等場(chǎng)景。

DeepSeek打響了國(guó)產(chǎn)模型開(kāi)源的第一槍?zhuān)_(kāi)啟了AI時(shí)代的模型革命，此后涌現(xiàn)出來(lái)自智譜、Minimax、月之暗面等多家中國(guó)企業(yè)的開(kāi)源模型，但實(shí)際采用規(guī)模仍然不及Qwen。

阿里的Qwen憑借較高的智能水平，在Hugging Face下載量、GitHub星標(biāo)數(shù)、本地LLM推理部署和微調(diào)社區(qū)活躍度等大模型核心衡量指標(biāo)上持續(xù)領(lǐng)跑。

目前，歐美國(guó)家仍然未能取代Llama，盡管Meta已經(jīng)停止對(duì)于Llama的更新。對(duì)于其他國(guó)外開(kāi)源模型，OpenAI的GPT-OSS系列在部分基準(zhǔn)測(cè)試中接近Minimax M2，在開(kāi)源模型中展現(xiàn)出了較高的智能水平，但開(kāi)發(fā)者采用率仍然不理想。因此，歐美國(guó)家的開(kāi)源生態(tài)已經(jīng)陷入“青黃不接”的局面。

當(dāng)然，Qwen系列模型也并非無(wú)懈可擊。對(duì)于超大規(guī)模的模型，DeepSeek的知名產(chǎn)品V3和R1反而更加受到美國(guó)初創(chuàng)公司的歡迎。

短評(píng)：

開(kāi)源促進(jìn)技術(shù)進(jìn)步已是不爭(zhēng)的事實(shí)。阿里的Qwen在開(kāi)源市場(chǎng)的競(jìng)爭(zhēng)中，成功做到在“質(zhì)”有保證的前提下靠“量”取勝。對(duì)于大部分開(kāi)發(fā)者來(lái)說(shuō)，技術(shù)無(wú)國(guó)界，良好的綜合體驗(yàn)才是選擇模型的第一理由，例如黃仁勛鐘愛(ài)Cursor，Gemini的首席工程師贊美Claude Code。當(dāng)下，Llama頹勢(shì)已經(jīng)顯露，此時(shí)正是Qwen等企業(yè)掌握開(kāi)源大模型主導(dǎo)權(quán)的最佳時(shí)機(jī)。

商業(yè)動(dòng)態(tài)（融資/合作/財(cái)報(bào)）

①Anthropic計(jì)劃融資100億美元，估值達(dá)到3500億

根據(jù)華爾街日?qǐng)?bào)消息，Anthropic預(yù)計(jì)將以3500億美元的投前估值融資100億美元。而僅僅在四個(gè)月前，Anthropic的估值僅為1830億美元，如今已經(jīng)接近翻倍。

本輪融資的領(lǐng)投者為GIC和Coatue Management，獨(dú)立于微軟、英偉達(dá)此前承諾的共150億美元的投資。

按照2025年11月微軟、英偉達(dá)和Anthropic公布的合作協(xié)議內(nèi)容，Anthropic將向微軟采購(gòu)共300億美元的算力設(shè)備，并在其Azure云平臺(tái)上大規(guī)模部署基于英偉達(dá)芯片的AI系統(tǒng)。

目前，Anthropic旗下的代表產(chǎn)品為終端AI編程助手Claude Code以及其中包含的Opus 4.5 / Sonnet 4.5 / Haiku 4.5，分別覆蓋高性能、平衡性和輕量高速三種應(yīng)用場(chǎng)景。

Claude Code已經(jīng)成為大多數(shù)程序員的首選AI工具，具備相當(dāng)高的應(yīng)用價(jià)值，甚至Google Gemini團(tuán)隊(duì)的首席工程師都對(duì)Claude Code贊不絕口。而在模型的智能化程度方面，Claude Opus 4.5在各大評(píng)測(cè)榜單中也是名列前茅，與Gemini 3 Pro、GPT-5.2同處于最高檔位。

短評(píng)：

幾家全球最頂尖的AI企業(yè)紛紛開(kāi)始大規(guī)模融資，高端模型的市場(chǎng)競(jìng)爭(zhēng)變得更加激烈，每家企業(yè)都希望能夠?qū)崿F(xiàn)技術(shù)層面上的率先突破，同時(shí)讓產(chǎn)品實(shí)現(xiàn)更大規(guī)模的應(yīng)用。

Anthropic不具備Google和OpenAI一樣龐大的用戶(hù)生態(tài)，短期內(nèi)快速提升用戶(hù)基數(shù)并不現(xiàn)實(shí)。但是，Anthropic憑借其強(qiáng)大的編程能力，能夠穩(wěn)定住程序員這一粘性和付費(fèi)意愿均較高的使用群體，以此作為核心競(jìng)爭(zhēng)力。

不過(guò)，目前Gemini在編程方面正在加速追趕，逐漸開(kāi)始成為Claude Code的替代品，Anthropic如何維持護(hù)城河將成為其參與競(jìng)爭(zhēng)的關(guān)鍵。

政策變化（監(jiān)管/安全/標(biāo)準(zhǔn)/政策）

①首例AI聊天機(jī)器人致青少年自殘案：谷歌和Character.AI與受害者家庭和解

根據(jù)美國(guó)法庭相關(guān)文件披露，Google及AI聊天機(jī)器人公司Character.AI已經(jīng)與多起青少年自殺、自殘事件的家庭達(dá)成“原則上的和解”。

這是全球首批因?yàn)锳I聊天機(jī)器人生成不當(dāng)內(nèi)容導(dǎo)致嚴(yán)重人身傷害而進(jìn)入和解階段的訴訟，AI的責(zé)任問(wèn)題正式進(jìn)入了司法實(shí)踐階段。

最受關(guān)注的案件來(lái)自佛羅里達(dá)州：一位14歲的少年Sewell Setzer因沉迷Character.AI上的一款“《權(quán)力的游戲》丹妮莉絲”角色聊天機(jī)器人，在進(jìn)行露骨對(duì)話(huà)后自殺。其母親Megan Garcia指控這款A(yù)I產(chǎn)品鼓勵(lì)其子結(jié)束生命，并認(rèn)為Google作為其投資方和技術(shù)合作方應(yīng)被視為“共同創(chuàng)作者”。

出于輿論和訴訟的壓力，Character.AI已經(jīng)在2025年10月宣布全面禁止18歲以下用戶(hù)使用開(kāi)放角色聊天功能，此后對(duì)未成年用戶(hù)啟用獨(dú)立、內(nèi)容受限的模型及監(jiān)護(hù)人控制。目前，和解金額尚未披露，企業(yè)也未承認(rèn)法律責(zé)任。

短評(píng)：

很多人把AI當(dāng)作輔助工作的工具，卻忽視了AI的情感陪伴功能。當(dāng)AI能在陪聊時(shí)做出誘導(dǎo)，技術(shù)便不再位于中立的立場(chǎng)。該案例足以顯示此前中國(guó)網(wǎng)信辦規(guī)范AI擬人化服務(wù)這一舉措的先見(jiàn)之明。

未來(lái)，加強(qiáng)AI內(nèi)容審核迫在眉睫，各國(guó)法律需要完善未成年人保護(hù)機(jī)制與責(zé)任界定標(biāo)準(zhǔn)。

原文標(biāo)題 : 大模型日?qǐng)?bào)| 文心、千問(wèn)躋身全球前列，Anthropic估值3500億美元