訂閱
糾錯(cuò)
加入自媒體

大模型日?qǐng)?bào)| Gemini首席工程師震驚了

01

重大發(fā)布(新模型/產(chǎn)品/開源)

 ① 英偉達(dá)平臺(tái)引入國產(chǎn)先進(jìn)模型,GLM-4.7 與 Minimax-M2.1 開放免費(fèi)調(diào)用

近日,隨著國內(nèi)AI公司智譜與Minimax相繼公布港股上市進(jìn)程,英偉達(dá)迅速跟進(jìn),在其NVIDIA NIM API平臺(tái)上正式接入兩家公司的最新大語言模型——GLM-4.7與Minimax M2.1。該平臺(tái)致力于將大模型封裝為即插即用的微服務(wù),大幅降低開發(fā)者的部署與調(diào)試門檻。

目前,用戶注冊(cè)英偉達(dá)賬號(hào)并生成API Key后,即可通過編程方式免費(fèi)調(diào)用這兩款模型。盡管在官方模型廣場(chǎng)中尚未直接列出,但實(shí)際接口已開放使用。

初期測(cè)試顯示,在通用對(duì)話場(chǎng)景中,GLM-4.7的響應(yīng)速度約為每秒25個(gè)token,而Minimax-M2.1則可達(dá)每秒150個(gè)token,推測(cè)可能與模型新上線、資源仍在調(diào)配有關(guān)。

短評(píng):

此舉形成多方共贏:開發(fā)者得以規(guī)避繁瑣的部署流程,快速集成先進(jìn)模型能力;國內(nèi)AI企業(yè)則通過英偉達(dá)的全球生態(tài),有效提升其技術(shù)在國際舞臺(tái)的能見度;而對(duì)英偉達(dá)而言,提供最新模型的免費(fèi)嘗試,也有助于鞏固其開發(fā)者社區(qū)與平臺(tái)黏性。技術(shù)無國界,生態(tài)共生長(zhǎng),或?yàn)锳I全球化協(xié)作的一頁新注腳。

② Grok 新版疑似曝光,xAI 神秘模型現(xiàn)身評(píng)測(cè)榜單

近期,有AI研究者在知名大模型評(píng)測(cè)平臺(tái)LMS Arena及DesignArena中發(fā)現(xiàn)數(shù)款名稱奇特的新模型記錄,分別為“Vortexshade”“Quantumcrow”與“Obsidian”。

其命名風(fēng)格與以往xAI產(chǎn)品的代號(hào)高度相似,經(jīng)簡(jiǎn)單測(cè)試后,多數(shù)推測(cè)指向它們或?yàn)镚rok系列即將發(fā)布的新版本。

短評(píng):

盡管Grok在智能表現(xiàn)上已接近第一梯隊(duì),但其實(shí)際用戶規(guī)模與生態(tài)影響力仍與GPT、Gemini等頭部產(chǎn)品存在顯著差距。在AI競(jìng)爭(zhēng)日趨聚焦于實(shí)際應(yīng)用的當(dāng)下,Grok在多模態(tài)與合規(guī)安全等方面仍面臨挑戰(zhàn)。

③ OpenAI 布局無屏語音交互,計(jì)劃推出對(duì)話式AI硬件

據(jù)TechCrunch報(bào)道,OpenAI正組建專項(xiàng)團(tuán)隊(duì),研發(fā)新一代具備連續(xù)、自然對(duì)話能力的AI語音設(shè)備,目標(biāo)在2026年推出首款無屏幕個(gè)人助理產(chǎn)品。該設(shè)備旨在突破當(dāng)前語音助手“一問一答”的機(jī)械交互,支持打斷、重疊對(duì)話等更貼近真人交流的溝通方式,如同一位置身耳畔的智能搭檔。

實(shí)際上,OpenAI并非唯一聚焦語音賽道的玩家:Meta已在Ray-Ban智能眼鏡中集成多麥克風(fēng)系統(tǒng),以提升嘈雜環(huán)境下的語音識(shí)別;Google正測(cè)試“語音摘要搜索”,將文字信息轉(zhuǎn)化為語音播報(bào);Tesla則于車機(jī)系統(tǒng)接入Grok,支持自然語言操控車輛功能。

短評(píng):

從圖形界面到觸控操作,每一次交互方式的變革都重塑著技術(shù)入口。OpenAI此次轉(zhuǎn)向,正是對(duì)“后屏幕時(shí)代”交互形態(tài)的一次前瞻押注。

然而,語音交互硬件之路不乏前車之鑒:Humane AI Pin因體驗(yàn)不佳折戟,Google的XR探索亦屢遇預(yù)期落差?梢,如何將技術(shù)能力轉(zhuǎn)化為流暢、可靠的用戶體驗(yàn),仍是所有入局者必須回答的關(guān)鍵命題。

02

技術(shù)進(jìn)展(論文/SOTA/算法)

① Claude Code 編程能力震驚業(yè)界,被指“一小時(shí)完成一年工作量”|

過去24小時(shí)內(nèi),谷歌Gemini團(tuán)隊(duì)首席工程師Jaana Dogan在社交平臺(tái)連續(xù)發(fā)文,透露其團(tuán)隊(duì)耗時(shí)一年研發(fā)的“分布式代理編排器”項(xiàng)目,在向Claude Code提出需求后,僅用一小時(shí)即獲得一套結(jié)構(gòu)完整、可直接運(yùn)行的程序代碼。

她對(duì)此表示“不是焦慮,而是敬佩”,并指出盡管出于安全考慮,該代碼無法直接用于谷歌核心項(xiàng)目,但其完成度與團(tuán)隊(duì)一年探索的成果已達(dá)同一水準(zhǔn)。

Dogan同時(shí)強(qiáng)調(diào),AI生成的代碼仍須人工審查與迭代優(yōu)化,但這標(biāo)志著AI編程能力已從“片段補(bǔ)全”躍升至“系統(tǒng)級(jí)意圖理解”階段。

短評(píng):

盡管目前僅為個(gè)案分享、未公開完整代碼,但其揭示的趨勢(shì)已足夠清晰:AI編程正以指數(shù)速度進(jìn)入“系統(tǒng)級(jí)輔助”新階段。程序員或許不會(huì)因此失業(yè),但駕馭AI工具以提升效率,必將成為未來開發(fā)者的必備素養(yǎng)。

從“不重復(fù)造輪子”到“不重復(fù)造整車”,高質(zhì)量代碼的自動(dòng)化生成,很可能成為AI技術(shù)商業(yè)化落地最為順暢的領(lǐng)域之一。

03

算力與基礎(chǔ)設(shè)施(芯片/云/數(shù)據(jù)中心)

① Anthropic 豪擲210億美元,向博通采購百萬顆TPU芯片

據(jù)半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis披露,Anthropic已與博通達(dá)成協(xié)議,采購約100萬個(gè)TPU v7p芯片,用于自建數(shù)據(jù)中心集群。這批芯片由谷歌與博通聯(lián)合設(shè)計(jì),但此次交易中博通將直接向Anthropic提供整機(jī)架系統(tǒng),谷歌則以IP授權(quán)方身份獲取相應(yīng)費(fèi)用。

博通CEO在12月投資者會(huì)議上證實(shí),Anthropic的AI相關(guān)訂單總額已達(dá)210億美元,且因整機(jī)架出貨模式,該批訂單毛利率有所降低。

短評(píng):

這一采購動(dòng)向,折射出AI算力供應(yīng)鏈的深層演變:博通從芯片設(shè)計(jì)商轉(zhuǎn)向系統(tǒng)集成供應(yīng)商,谷歌則從硬件銷售轉(zhuǎn)為知識(shí)產(chǎn)權(quán)授權(quán)。

隨著谷歌、OpenAI、Anthropic等頭部公司紛紛與博通簽署大額訂單,并大規(guī)模采用自研或定制芯片(如TPU),長(zhǎng)期以來英偉達(dá)在高端AI算力市場(chǎng)的“單一主導(dǎo)”局面,正悄然呈現(xiàn)出多元化解構(gòu)的趨勢(shì)。

       原文標(biāo)題 : 大模型日?qǐng)?bào)| Gemini首席工程師震驚了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)