訂閱
糾錯
加入自媒體

大模型日報| Gemini首席工程師震驚了

2026-01-05 09:42
硅基星芒
關注

01

重大發(fā)布(新模型/產(chǎn)品/開源)

 ① 英偉達平臺引入國產(chǎn)先進模型,GLM-4.7 與 Minimax-M2.1 開放免費調(diào)用

近日,隨著國內(nèi)AI公司智譜與Minimax相繼公布港股上市進程,英偉達迅速跟進,在其NVIDIA NIM API平臺上正式接入兩家公司的最新大語言模型——GLM-4.7與Minimax M2.1。該平臺致力于將大模型封裝為即插即用的微服務,大幅降低開發(fā)者的部署與調(diào)試門檻。

目前,用戶注冊英偉達賬號并生成API Key后,即可通過編程方式免費調(diào)用這兩款模型。盡管在官方模型廣場中尚未直接列出,但實際接口已開放使用。

初期測試顯示,在通用對話場景中,GLM-4.7的響應速度約為每秒25個token,而Minimax-M2.1則可達每秒150個token,推測可能與模型新上線、資源仍在調(diào)配有關。

短評:

此舉形成多方共贏:開發(fā)者得以規(guī)避繁瑣的部署流程,快速集成先進模型能力;國內(nèi)AI企業(yè)則通過英偉達的全球生態(tài),有效提升其技術在國際舞臺的能見度;而對英偉達而言,提供最新模型的免費嘗試,也有助于鞏固其開發(fā)者社區(qū)與平臺黏性。技術無國界,生態(tài)共生長,或為AI全球化協(xié)作的一頁新注腳。

② Grok 新版疑似曝光,xAI 神秘模型現(xiàn)身評測榜單

近期,有AI研究者在知名大模型評測平臺LMS Arena及DesignArena中發(fā)現(xiàn)數(shù)款名稱奇特的新模型記錄,分別為“Vortexshade”“Quantumcrow”與“Obsidian”。

其命名風格與以往xAI產(chǎn)品的代號高度相似,經(jīng)簡單測試后,多數(shù)推測指向它們或為Grok系列即將發(fā)布的新版本。

短評:

盡管Grok在智能表現(xiàn)上已接近第一梯隊,但其實際用戶規(guī)模與生態(tài)影響力仍與GPT、Gemini等頭部產(chǎn)品存在顯著差距。在AI競爭日趨聚焦于實際應用的當下,Grok在多模態(tài)與合規(guī)安全等方面仍面臨挑戰(zhàn)。

③ OpenAI 布局無屏語音交互,計劃推出對話式AI硬件

據(jù)TechCrunch報道,OpenAI正組建專項團隊,研發(fā)新一代具備連續(xù)、自然對話能力的AI語音設備,目標在2026年推出首款無屏幕個人助理產(chǎn)品。該設備旨在突破當前語音助手“一問一答”的機械交互,支持打斷、重疊對話等更貼近真人交流的溝通方式,如同一位置身耳畔的智能搭檔。

實際上,OpenAI并非唯一聚焦語音賽道的玩家:Meta已在Ray-Ban智能眼鏡中集成多麥克風系統(tǒng),以提升嘈雜環(huán)境下的語音識別;Google正測試“語音摘要搜索”,將文字信息轉化為語音播報;Tesla則于車機系統(tǒng)接入Grok,支持自然語言操控車輛功能。

短評:

從圖形界面到觸控操作,每一次交互方式的變革都重塑著技術入口。OpenAI此次轉向,正是對“后屏幕時代”交互形態(tài)的一次前瞻押注。

然而,語音交互硬件之路不乏前車之鑒:Humane AI Pin因體驗不佳折戟,Google的XR探索亦屢遇預期落差?梢,如何將技術能力轉化為流暢、可靠的用戶體驗,仍是所有入局者必須回答的關鍵命題。

02

技術進展(論文/SOTA/算法)

① Claude Code 編程能力震驚業(yè)界,被指“一小時完成一年工作量”|

過去24小時內(nèi),谷歌Gemini團隊首席工程師Jaana Dogan在社交平臺連續(xù)發(fā)文,透露其團隊耗時一年研發(fā)的“分布式代理編排器”項目,在向Claude Code提出需求后,僅用一小時即獲得一套結構完整、可直接運行的程序代碼。

她對此表示“不是焦慮,而是敬佩”,并指出盡管出于安全考慮,該代碼無法直接用于谷歌核心項目,但其完成度與團隊一年探索的成果已達同一水準。

Dogan同時強調(diào),AI生成的代碼仍須人工審查與迭代優(yōu)化,但這標志著AI編程能力已從“片段補全”躍升至“系統(tǒng)級意圖理解”階段。

短評:

盡管目前僅為個案分享、未公開完整代碼,但其揭示的趨勢已足夠清晰:AI編程正以指數(shù)速度進入“系統(tǒng)級輔助”新階段。程序員或許不會因此失業(yè),但駕馭AI工具以提升效率,必將成為未來開發(fā)者的必備素養(yǎng)。

從“不重復造輪子”到“不重復造整車”,高質量代碼的自動化生成,很可能成為AI技術商業(yè)化落地最為順暢的領域之一。

03

算力與基礎設施(芯片/云/數(shù)據(jù)中心)

① Anthropic 豪擲210億美元,向博通采購百萬顆TPU芯片

據(jù)半導體分析機構SemiAnalysis披露,Anthropic已與博通達成協(xié)議,采購約100萬個TPU v7p芯片,用于自建數(shù)據(jù)中心集群。這批芯片由谷歌與博通聯(lián)合設計,但此次交易中博通將直接向Anthropic提供整機架系統(tǒng),谷歌則以IP授權方身份獲取相應費用。

博通CEO在12月投資者會議上證實,Anthropic的AI相關訂單總額已達210億美元,且因整機架出貨模式,該批訂單毛利率有所降低。

短評:

這一采購動向,折射出AI算力供應鏈的深層演變:博通從芯片設計商轉向系統(tǒng)集成供應商,谷歌則從硬件銷售轉為知識產(chǎn)權授權。

隨著谷歌、OpenAI、Anthropic等頭部公司紛紛與博通簽署大額訂單,并大規(guī)模采用自研或定制芯片(如TPU),長期以來英偉達在高端AI算力市場的“單一主導”局面,正悄然呈現(xiàn)出多元化解構的趨勢。

       原文標題 : 大模型日報| Gemini首席工程師震驚了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號