123,123

大模型日報| Gemini首席工程師震驚了

2026-01-05 09:42

重大發(fā)布（新模型/產(chǎn)品/開源）

① 英偉達平臺引入國產(chǎn)先進模型，GLM-4.7 與 Minimax-M2.1 開放免費調(diào)用

近日，隨著國內(nèi)AI公司智譜與Minimax相繼公布港股上市進程，英偉達迅速跟進，在其NVIDIA NIM API平臺上正式接入兩家公司的最新大語言模型——GLM-4.7與Minimax M2.1。該平臺致力于將大模型封裝為即插即用的微服務，大幅降低開發(fā)者的部署與調(diào)試門檻。

目前，用戶注冊英偉達賬號并生成API Key后，即可通過編程方式免費調(diào)用這兩款模型。盡管在官方模型廣場中尚未直接列出，但實際接口已開放使用。

初期測試顯示，在通用對話場景中，GLM-4.7的響應速度約為每秒25個token，而Minimax-M2.1則可達每秒150個token，推測可能與模型新上線、資源仍在調(diào)配有關。

短評：

此舉形成多方共贏：開發(fā)者得以規(guī)避繁瑣的部署流程，快速集成先進模型能力；國內(nèi)AI企業(yè)則通過英偉達的全球生態(tài)，有效提升其技術在國際舞臺的能見度；而對英偉達而言，提供最新模型的免費嘗試，也有助于鞏固其開發(fā)者社區(qū)與平臺黏性。技術無國界，生態(tài)共生長，或為AI全球化協(xié)作的一頁新注腳。

② Grok 新版疑似曝光，xAI 神秘模型現(xiàn)身評測榜單

近期，有AI研究者在知名大模型評測平臺LMS Arena及DesignArena中發(fā)現(xiàn)數(shù)款名稱奇特的新模型記錄，分別為“Vortexshade”“Quantumcrow”與“Obsidian”。

其命名風格與以往xAI產(chǎn)品的代號高度相似，經(jīng)簡單測試后，多數(shù)推測指向它們或為Grok系列即將發(fā)布的新版本。

短評：

盡管Grok在智能表現(xiàn)上已接近第一梯隊，但其實際用戶規(guī)模與生態(tài)影響力仍與GPT、Gemini等頭部產(chǎn)品存在顯著差距。在AI競爭日趨聚焦于實際應用的當下，Grok在多模態(tài)與合規(guī)安全等方面仍面臨挑戰(zhàn)。

③ OpenAI 布局無屏語音交互，計劃推出對話式AI硬件

據(jù)TechCrunch報道，OpenAI正組建專項團隊，研發(fā)新一代具備連續(xù)、自然對話能力的AI語音設備，目標在2026年推出首款無屏幕個人助理產(chǎn)品。該設備旨在突破當前語音助手“一問一答”的機械交互，支持打斷、重疊對話等更貼近真人交流的溝通方式，如同一位置身耳畔的智能搭檔。

實際上，OpenAI并非唯一聚焦語音賽道的玩家：Meta已在Ray-Ban智能眼鏡中集成多麥克風系統(tǒng)，以提升嘈雜環(huán)境下的語音識別；Google正測試“語音摘要搜索”，將文字信息轉化為語音播報；Tesla則于車機系統(tǒng)接入Grok，支持自然語言操控車輛功能。

短評：

從圖形界面到觸控操作，每一次交互方式的變革都重塑著技術入口。OpenAI此次轉向，正是對“后屏幕時代”交互形態(tài)的一次前瞻押注。

然而，語音交互硬件之路不乏前車之鑒：Humane AI Pin因體驗不佳折戟，Google的XR探索亦屢遇預期落差�？梢�，如何將技術能力轉化為流暢、可靠的用戶體驗，仍是所有入局者必須回答的關鍵命題。

技術進展（論文/SOTA/算法）

① Claude Code 編程能力震驚業(yè)界，被指“一小時完成一年工作量”|

過去24小時內(nèi)，谷歌Gemini團隊首席工程師Jaana Dogan在社交平臺連續(xù)發(fā)文，透露其團隊耗時一年研發(fā)的“分布式代理編排器”項目，在向Claude Code提出需求后，僅用一小時即獲得一套結構完整、可直接運行的程序代碼。

她對此表示“不是焦慮，而是敬佩”，并指出盡管出于安全考慮，該代碼無法直接用于谷歌核心項目，但其完成度與團隊一年探索的成果已達同一水準。

Dogan同時強調(diào)，AI生成的代碼仍須人工審查與迭代優(yōu)化，但這標志著AI編程能力已從“片段補全”躍升至“系統(tǒng)級意圖理解”階段。

短評：

盡管目前僅為個案分享、未公開完整代碼，但其揭示的趨勢已足夠清晰：AI編程正以指數(shù)速度進入“系統(tǒng)級輔助”新階段。程序員或許不會因此失業(yè)，但駕馭AI工具以提升效率，必將成為未來開發(fā)者的必備素養(yǎng)。

從“不重復造輪子”到“不重復造整車”，高質量代碼的自動化生成，很可能成為AI技術商業(yè)化落地最為順暢的領域之一。

算力與基礎設施（芯片/云/數(shù)據(jù)中心）

① Anthropic 豪擲210億美元，向博通采購百萬顆TPU芯片

據(jù)半導體分析機構SemiAnalysis披露，Anthropic已與博通達成協(xié)議，采購約100萬個TPU v7p芯片，用于自建數(shù)據(jù)中心集群。這批芯片由谷歌與博通聯(lián)合設計，但此次交易中博通將直接向Anthropic提供整機架系統(tǒng)，谷歌則以IP授權方身份獲取相應費用。

博通CEO在12月投資者會議上證實，Anthropic的AI相關訂單總額已達210億美元，且因整機架出貨模式，該批訂單毛利率有所降低。

短評：

這一采購動向，折射出AI算力供應鏈的深層演變：博通從芯片設計商轉向系統(tǒng)集成供應商，谷歌則從硬件銷售轉為知識產(chǎn)權授權。

隨著谷歌、OpenAI、Anthropic等頭部公司紛紛與博通簽署大額訂單，并大規(guī)模采用自研或定制芯片（如TPU），長期以來英偉達在高端AI算力市場的“單一主導”局面，正悄然呈現(xiàn)出多元化解構的趨勢。

原文標題 : 大模型日報| Gemini首席工程師震驚了