訂閱
糾錯(cuò)
加入自媒體

大模型日?qǐng)?bào)| 英偉達(dá)在CES2026上的三宗事

01

算力與基礎(chǔ)設(shè)施(芯片/云/數(shù)據(jù)中心)

①CES 2026:英偉達(dá)Rubin系列芯片與自動(dòng)駕駛AI登場(chǎng)

同樣是在2026年國(guó)際消費(fèi)電子展上,被谷歌TPU逐漸打破生態(tài)壁壘的英偉達(dá)選擇開(kāi)年出擊。黃仁勛在今年第一場(chǎng)演講上著重強(qiáng)調(diào)了以下三部分內(nèi)容:

一是2025年開(kāi)源模型正在改變AI行業(yè)。

提及開(kāi)源模型,首當(dāng)其沖的必然是DeepSeek R1這個(gè)被黃仁勛描述為“讓整個(gè)世界震驚”的國(guó)產(chǎn)模型。自R1發(fā)布以來(lái),AI開(kāi)始進(jìn)入全球擴(kuò)散化階段,相比最前沿的AI模型,開(kāi)源模型僅僅落后約6個(gè)月,而這一距離正在肉眼可見(jiàn)地縮短。技術(shù)無(wú)法被徹底封鎖,依靠閉源實(shí)現(xiàn)壟斷的路徑幾乎不可能走通,只有擁抱開(kāi)源才能構(gòu)建龐大的生態(tài)環(huán)境。

黃仁勛表示,英偉達(dá)會(huì)將很多數(shù)據(jù)庫(kù)進(jìn)行開(kāi)源(包括復(fù)雜的物理、生物數(shù)據(jù)),允許用戶(hù)處理并生成數(shù)據(jù),幫助用戶(hù)完成模型的創(chuàng)造、訓(xùn)練、評(píng)估、約束和部署的閉環(huán)。

黃仁勛稱(chēng),英偉達(dá)采用完全公開(kāi)的方式,讓每家公司、每個(gè)行業(yè)、每個(gè)國(guó)家都成為AI革命的一部分。 

二是推出全球首個(gè)專(zhuān)門(mén)為自動(dòng)駕駛設(shè)計(jì)的思考與推理模型Alpamayo。

該模型引入了視覺(jué)語(yǔ)言動(dòng)作模型(VLA),通過(guò)向自動(dòng)駕駛的決策過(guò)程中加入人類(lèi)思維以提升安全性和應(yīng)急處理能力。英偉達(dá)將這一模型以及包含上千小時(shí)的物理數(shù)據(jù)同時(shí)開(kāi)源,用戶(hù)可以自行獲取并微調(diào)該模型。

三是英偉達(dá)全新一代計(jì)算平臺(tái)Vera Rubin全面投產(chǎn)。

黃仁勛表示,訓(xùn)練和推理階段所需的算力仍然在不斷激增,模型的規(guī)模每年大概要擴(kuò)大10倍,“Test-Time Scaling”每年在推理階段消耗的token數(shù)量增長(zhǎng)大概五倍,而token成本則每年要便宜10倍。因此,AI競(jìng)爭(zhēng)的本質(zhì)仍然是計(jì)算問(wèn)題。計(jì)算速度的提升意味著更快達(dá)到下一個(gè)領(lǐng)域的新高度。

為此,英偉達(dá)設(shè)計(jì)的Vera Rubin計(jì)算平臺(tái)恰好在AI的下一個(gè)前沿領(lǐng)域到來(lái)之際開(kāi)始投產(chǎn)。按照英偉達(dá)內(nèi)部準(zhǔn)則,新一代產(chǎn)品不應(yīng)該更換超過(guò)2枚芯片。

不過(guò),由于摩爾定律放緩,英偉達(dá)每年能夠獲得的晶體管數(shù)量已經(jīng)無(wú)法匹配模型規(guī)模和tokens消耗量的迅速擴(kuò)大,因此英偉達(dá)別無(wú)選擇,只能采用更為激進(jìn)的方式:Vera Rubin是一個(gè)由6枚芯片設(shè)計(jì)為協(xié)同工作的系統(tǒng),誕生于極端代碼設(shè)計(jì)。

IMG_256

根據(jù)演講公布的數(shù)據(jù),Vera Rubin NVL72系統(tǒng)相比前代Blackwell系統(tǒng),各項(xiàng)數(shù)據(jù)指標(biāo)均實(shí)現(xiàn)顯著提升,其中在FP4推理算力和訓(xùn)練算力上分別增強(qiáng)至3.6倍和2.5倍,整個(gè)機(jī)柜包含220萬(wàn)億個(gè)晶體管。除此之外,黃仁勛親自演示了計(jì)算節(jié)點(diǎn)的組裝,耗時(shí)從前代的2個(gè)小時(shí)壓縮到了5分鐘,系統(tǒng)實(shí)現(xiàn)100%液冷。

addad2f42e956815bc0d9279e384e475

性能方面,以訓(xùn)練一個(gè)10萬(wàn)億參數(shù)規(guī)模的模型、使用100萬(wàn)億個(gè)token為例,Rubin NVL72所需的GPU數(shù)量?jī)H為Blackwell NVL72的1/4;大規(guī)模部署場(chǎng)景下,能夠處理的token數(shù)量是Blackwell的10倍;token成本則壓縮到了Blackwell的1/10。

短評(píng):

這次英偉達(dá)“開(kāi)源模型+自動(dòng)駕駛+計(jì)算平臺(tái)”三軍齊出,可見(jiàn)以谷歌TPU為首的ASIC對(duì)英偉達(dá)造成的壓力非同小可。在其他廠商開(kāi)始嘗試在特定場(chǎng)景實(shí)現(xiàn)更高的能效比的同時(shí),英偉達(dá)轉(zhuǎn)向了全棧系統(tǒng)能力的競(jìng)爭(zhēng)。

Rubin平臺(tái)作為一個(gè)可編程、可組合、支持多模態(tài)負(fù)載的AI系統(tǒng),進(jìn)一步擴(kuò)大了英偉達(dá)生態(tài)環(huán)境的覆蓋范圍,而推理成本和訓(xùn)練效率的改進(jìn)讓英偉達(dá)能夠用系統(tǒng)級(jí)的優(yōu)化對(duì)沖ASIC的能效優(yōu)勢(shì)。

與此同時(shí),黃仁勛對(duì)于開(kāi)源模型的贊美以及Alpamayo的開(kāi)源,則說(shuō)明英偉達(dá)的護(hù)城河已經(jīng)不再穩(wěn)定,需要通過(guò)開(kāi)源換取生態(tài)主導(dǎo)權(quán)。本次演講中反復(fù)強(qiáng)調(diào)的物理AI則是英偉達(dá)押注的下一片AI主戰(zhàn)場(chǎng),具身智能、機(jī)器人和自動(dòng)駕駛將成為未來(lái)AI應(yīng)用的重點(diǎn)。

③CES 2026:AMD發(fā)布新一代AI PC芯片&游戲處理器

AMD在此次國(guó)際消費(fèi)電子展上宣布了一系列新的AI處理器,表示AI驅(qū)動(dòng)的個(gè)人端PC將會(huì)是未來(lái)的趨勢(shì)。

本次發(fā)布的是AMD Ryzen AI 400系列處理器,也是AMD AI驅(qū)動(dòng)PC芯片的最新版本。相比競(jìng)爭(zhēng)對(duì)手,多任務(wù)處理性能比競(jìng)品快1.3倍,視頻剪輯和圖像生成等創(chuàng)作任務(wù)快1.7倍,內(nèi)置12核24線程,專(zhuān)門(mén)為本地AI推理而進(jìn)行優(yōu)化。

生態(tài)環(huán)境上,目前已有250款以上的AI PC已經(jīng)搭載AMD芯片,在過(guò)去的一年時(shí)間內(nèi)實(shí)現(xiàn)了翻倍。同時(shí),全新的Ryzen 7 9850X3D游戲CPU被視為目前最強(qiáng)大的游戲CPU,搭配最新版本的Redstone光追技術(shù),能夠在保持幀率不降的情況下實(shí)現(xiàn)更真實(shí)的光影效果。

短評(píng):

相比英偉達(dá)首次沒(méi)有在演講中提及消費(fèi)級(jí)顯卡,甚至減產(chǎn)RTX 5070 / 5060 Ti等產(chǎn)品,AMD更傾向于將目標(biāo)聚焦于個(gè)人電腦端和輕量級(jí)AI,差異化的產(chǎn)品設(shè)計(jì)方向也與AMD“讓每個(gè)人都用上AI”的目標(biāo)相匹配。

盡管二者發(fā)布的產(chǎn)品并非直接競(jìng)爭(zhēng)對(duì)手,但AMD的這次產(chǎn)品發(fā)布無(wú)疑能夠進(jìn)一步提高生態(tài)滲透率,同時(shí)增加輕量級(jí)模型的應(yīng)用場(chǎng)景。

02

重大發(fā)布(新模型/產(chǎn)品/開(kāi)源)

①CES 2026:Google TV接入Gemini,“邊緣化”的電視重回舞臺(tái)

2026年國(guó)際消費(fèi)電子展上,Google展示了將在其互聯(lián)網(wǎng)電視平臺(tái)Google TV上增加的多種Gemini相關(guān)功能,首發(fā)搭載于新款TCL電視,預(yù)計(jì)在未來(lái)幾個(gè)月內(nèi)覆蓋所有Google TV設(shè)備。

目前,Google TV上的Gemini支持的功能仍然較為簡(jiǎn)單:

一是根據(jù)用戶(hù)的指令進(jìn)行內(nèi)容查找和相關(guān)推薦;

二是允許用戶(hù)使用語(yǔ)音直接更改電視相關(guān)設(shè)置;

三是連接谷歌相冊(cè)進(jìn)行圖像處理;

四是與用戶(hù)針對(duì)特定話題進(jìn)行語(yǔ)音問(wèn)答式互動(dòng)。

以上功能除了必備的互聯(lián)網(wǎng)連接和谷歌賬戶(hù)以外,還需要Android TV OS 14以上版本方能支持運(yùn)行。

短評(píng):

電視作為上一代電子產(chǎn)品,如今的應(yīng)用范圍已經(jīng)極為有限。谷歌這次錦上添花的更新,幾乎不具備創(chuàng)新性,功能也較為局限,唯一的價(jià)值在于覆蓋了更廣泛的用戶(hù)群體。

②豆包大模型Doubao-Seed-1.8恢復(fù)公開(kāi)可用

2025年12月25日,廣受?chē)?guó)內(nèi)用戶(hù)好評(píng)的豆包1.8版本大模型在僅僅發(fā)布10天就宣告調(diào)整,變?yōu)楣珳y(cè)狀態(tài),僅允許白名單用戶(hù)使用。根據(jù)官方給出的原因,Doubao-Seed-1.8的視覺(jué)語(yǔ)言模型需要進(jìn)行調(diào)整,以便提供更高質(zhì)量的技術(shù)服務(wù)。

目前,該模型已經(jīng)重新開(kāi)放體驗(yàn),但在“智能路由”的全自動(dòng)模式下,其候選模型列表中仍然未包含Doubao-Seed-1.8。

短評(píng):

作為國(guó)內(nèi)目前最受歡迎的模型系列,豆包日均50萬(wàn)以上的tokens消耗量令人震驚。盡管官方?jīng)]有給出這次技術(shù)調(diào)整的具體細(xì)節(jié),但頻繁的請(qǐng)求導(dǎo)致字節(jié)的算力本就十分緊張,再加上近期AI安全性問(wèn)題不時(shí)暴露,于此時(shí)進(jìn)行緊急調(diào)整有利于完善使用體驗(yàn),短短幾天吊起用戶(hù)胃口也能進(jìn)一步拉動(dòng)模型需求增長(zhǎng)。

③國(guó)產(chǎn)醫(yī)療語(yǔ)言模型開(kāi)源:AntAngelMed拿下HealthBench榜首

昨日,浙江省衛(wèi)生健康信息中心聯(lián)合螞蟻健康、浙江省安診兒醫(yī)學(xué)人工智能科技有限公司聯(lián)合研發(fā)了這款名為AntAngelMed的模型,同時(shí)它也是目前規(guī)模最大、能力最強(qiáng)的開(kāi)源醫(yī)療語(yǔ)言模型之一。

IMG_256

該模型采用三階段的訓(xùn)練方式:

第一階段是持續(xù)預(yù)訓(xùn)練(Continual Pre-Training),大規(guī)模、高質(zhì)量的語(yǔ)料庫(kù)有助于模型學(xué)習(xí)專(zhuān)業(yè)領(lǐng)域的知識(shí);

第二階段是監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT),通過(guò)高質(zhì)量的指令數(shù)據(jù)集模擬醫(yī)學(xué)場(chǎng)景,提升臨床表現(xiàn);

第三階段是強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL),強(qiáng)調(diào)共情能力和安全邊界,減少幻覺(jué)概率。

同時(shí),這一醫(yī)療模型采用了高效的MoE架構(gòu),總參數(shù)100B,每次運(yùn)行只需要激活6.1B,在H20上的推理速度超過(guò)200 tokens/s,支持128K上下文窗口。

短評(píng):

盡管該模型性能非常強(qiáng)大,但其硬件配置需求略顯高昂,若想在實(shí)際場(chǎng)景中應(yīng)用至少需要H200級(jí)的計(jì)算性能;與此同時(shí),由于LLM概率預(yù)測(cè)器的本質(zhì)以及自回歸生成的機(jī)制,幻覺(jué)在本質(zhì)上難以完全避免,導(dǎo)致該模型在醫(yī)學(xué)領(lǐng)域的部分復(fù)雜場(chǎng)景中難以實(shí)際應(yīng)用。

03

 商業(yè)動(dòng)態(tài)(融資/合作/財(cái)報(bào))

①字節(jié)跳動(dòng)辟謠:豆包AI眼鏡目前無(wú)明確銷(xiāo)售計(jì)劃

幾天前,字節(jié)旗下的豆包AI眼鏡進(jìn)入出貨階段的消息讓AI硬件領(lǐng)域沸騰起來(lái),當(dāng)時(shí)傳出的消息是“總量10萬(wàn)臺(tái),采用高通AR1芯片”。不過(guò),今天上午字節(jié)正式否認(rèn)了這一傳言,明確告知目前暫無(wú)銷(xiāo)售計(jì)劃。

目前,AI可穿戴設(shè)備市場(chǎng)的競(jìng)爭(zhēng)已經(jīng)拉開(kāi)帷幕。2025年,國(guó)內(nèi)有百度的“小度AI眼鏡”、阿里的“夸克AI眼鏡”,國(guó)外有Meta的“Ray-Ban Display”,AR與AI能力的不斷提升促生出了這些廣受好評(píng)的新一代智能設(shè)備,在功能層面上已有替代手機(jī)的趨勢(shì)。2026年,谷歌預(yù)計(jì)發(fā)布代號(hào)為“Project Aura”的AI眼鏡,而字節(jié)的相關(guān)產(chǎn)品也即將誕生。

短評(píng):

盡管字節(jié)否認(rèn)了銷(xiāo)售計(jì)劃,但短短幾個(gè)小時(shí)內(nèi)兩條消息的接連發(fā)布,仍然存在造勢(shì)的可能。在市場(chǎng)已有多款同類(lèi)競(jìng)品發(fā)布的情況下,字節(jié)需要推出技術(shù)和用戶(hù)體驗(yàn)都更加完善的產(chǎn)品才能在市場(chǎng)中立足,而這正是坐擁豆包和抖音這兩款“國(guó)民級(jí)”應(yīng)用、掌握大量用戶(hù)使用偏好數(shù)據(jù)的字節(jié)的優(yōu)勢(shì)所在。

②Google DeepMind產(chǎn)品負(fù)責(zé)人:是時(shí)候重新開(kāi)始發(fā)貨了!

今天凌晨,Google Deepmind的產(chǎn)品負(fù)責(zé)人Logan Kilpatrick發(fā)布了一條耐人尋味的推文:

900871988e3e9f79e5a7edaa657a8060

幾個(gè)小時(shí)后,又發(fā)布了一條升級(jí)Google AI Studio儀表盤(pán)的消息:

29a5db67f15f7677093aaf7e16d07295

可以推測(cè),不久的未來(lái)Gemini將會(huì)有新產(chǎn)品誕生,目前廣泛猜測(cè)的可能性有兩個(gè):

一是Gemini 3的新檢查點(diǎn),即對(duì)現(xiàn)有Gemini 3模型的微調(diào)或?qū)R優(yōu)化;

二是Nano Banana 2 Flash,即圖像生成模型Nano Banana的輕量級(jí)版本。

短評(píng):

谷歌的產(chǎn)品矩陣已經(jīng)比較完善,無(wú)論是大語(yǔ)言模型還是多模態(tài)模型,使用體驗(yàn)都無(wú)可挑剔。本次發(fā)布的大概率不會(huì)是重量級(jí)新產(chǎn)品。但是,目前AI行業(yè)已經(jīng)向著Agent這一領(lǐng)域開(kāi)始進(jìn)發(fā),谷歌雖然具備全球數(shù)一數(shù)二的技術(shù)能力,但遲遲未有構(gòu)建Agent相關(guān)的大動(dòng)作。

不過(guò),考慮到谷歌在與OpenAI這位LLMs先驅(qū)者的競(jìng)爭(zhēng)中已經(jīng)實(shí)現(xiàn)彎道超車(chē),等到Agent的市場(chǎng)格局進(jìn)一步完善再出手也是不錯(cuò)的選擇。

       原文標(biāo)題 : 大模型日?qǐng)?bào)| 英偉達(dá)在CES2026上的三宗事

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)