訂閱
糾錯(cuò)
加入自媒體

大模型日?qǐng)?bào)| 元寶“辱罵”事件折射對(duì)齊困境,模型安全風(fēng)口悄然醞釀

01

重大發(fā)布(新模型/產(chǎn)品/開源)

① 智譜GLM-Image接入Hugging Face,多模態(tài)生態(tài)邁出關(guān)鍵一步

14小時(shí)前,智譜AI向Hugging Face Transformers主倉庫提交了一項(xiàng)重要更新,為其多模態(tài)模型GLM-Image加入完整自回歸支持。

此次更新并非簡(jiǎn)單接口封裝,而是新增超過5100行代碼,標(biāo)志著在上市前夕,智譜將其多模態(tài)能力正式集成至全球主流的AI開發(fā)框架。

此舉大幅降低了開發(fā)者的使用門檻——無需額外修改代碼或配置環(huán)境,即可沿用類似Llama的調(diào)用方式,一鍵加載并運(yùn)行這一中文多模態(tài)模型。

短評(píng):

繼GLM-4.7登陸英偉達(dá)API平臺(tái)后,GLM-Image再度融入全球開源生態(tài),實(shí)現(xiàn)“開箱即用”。這不僅意味著智譜在模型可用性上取得突破,更象征著中國(guó)AI模型正式獲得全球開發(fā)社區(qū)的“通行證”。多模態(tài)與純文本模型并行推進(jìn),正逐步構(gòu)建起更為完整的產(chǎn)品矩陣,其實(shí)際效能值得持續(xù)關(guān)注。

② MiroMind開源研究智能體MiroThinker v1.5:交互優(yōu)先,規(guī)模讓位于效用

MiroMind團(tuán)隊(duì)著眼于通用人工智能(AGI),但其路徑獨(dú)樹一幟:專注于“預(yù)測(cè)型大模型”,依托記憶驅(qū)動(dòng)機(jī)制,實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景下的復(fù)雜決策。MiroThinker定位為可聯(lián)網(wǎng)、檢索、編碼與思考的“AI研究員”,與普通聊天機(jī)器人形成鮮明區(qū)別。

本次開源提供30B與235B兩個(gè)版本:

30B模型在中文網(wǎng)頁理解測(cè)試BrowseComp-ZH中,以1/30的成本超越1T參數(shù)的Kimi-K2-Thinking;

235B版本則在多項(xiàng)基準(zhǔn)測(cè)試中刷新開源模型SOTA,支持256K上下文與400次工具調(diào)用,擅長(zhǎng)長(zhǎng)文檔分析與多步任務(wù)處理。

此次發(fā)布同時(shí)提出“交互擴(kuò)展”理念——不單純追求參數(shù)規(guī)模或上下文長(zhǎng)度,而是強(qiáng)化模型在任務(wù)執(zhí)行中與工具、環(huán)境的高頻深度交互,如自動(dòng)調(diào)用搜索、編程、文件操作等功能。

短評(píng):

MiroMind以“研究員”模型開辟差異賽道,既回應(yīng)實(shí)際科研需求,亦避免與已趨同質(zhì)化的國(guó)產(chǎn)模型正面競(jìng)爭(zhēng)。盡管在知名度與生態(tài)建設(shè)上尚不及頭部廠商,但其“交互擴(kuò)展”思路與高度工具化的設(shè)計(jì),已展現(xiàn)出清晰的技術(shù)特色與商業(yè)化潛能。

02

政策變化(監(jiān)管/安全/標(biāo)準(zhǔn)/政策)

① 騰訊元寶“辱罵回復(fù)”事件:概率黑洞與對(duì)齊機(jī)制的失效

近日,小紅書上一則關(guān)于騰訊元寶的對(duì)話引發(fā)熱議:一名程序員用戶在反復(fù)提交代碼修改請(qǐng)求后,竟收到模型帶有辱罵性質(zhì)的回復(fù)。盡管原帖已無法查看,事件卻揭示出大語言模型在安全對(duì)齊上的深層隱患。

從技術(shù)角度看,此類輸出并非“AI覺醒”或人為干預(yù),而是大語言模型作為概率生成器的固有風(fēng)險(xiǎn)。在極端上下文觸發(fā)下,模型可能從訓(xùn)練數(shù)據(jù)中復(fù)現(xiàn)包含攻擊性語言的模式——尤其是當(dāng)訓(xùn)練語料混雜社交媒體爭(zhēng)吵、投訴等場(chǎng)景時(shí),即便概率極低,仍可能不幸命中。

該事件同時(shí)暴露出現(xiàn)有對(duì)齊技術(shù)的局限性:

監(jiān)督微調(diào)(SFT):依賴人工標(biāo)注,覆蓋場(chǎng)景有限;

人類反饋強(qiáng)化學(xué)習(xí)(RLHF):能捕捉細(xì)致偏好,但易受評(píng)分者主觀影響;

后處理過濾:作為最后防線,卻可能被巧妙繞過,并增加響應(yīng)延遲。

 短評(píng):

數(shù)據(jù)污染與對(duì)齊機(jī)制的不完備,共同讓極小概率事件成為現(xiàn)實(shí)。這也提醒業(yè)界:在追求模型能力突破的同時(shí),必須同步構(gòu)筑更為穩(wěn)健的倫理與安全護(hù)欄。未來除了加強(qiáng)生成內(nèi)容的監(jiān)管,還需在技術(shù)層面引入任務(wù)類型識(shí)別、對(duì)抗測(cè)試等機(jī)制,從根源約束概率的“越界”。

03

算力與基礎(chǔ)設(shè)施(芯片/云/數(shù)據(jù)中心)

① 顯卡漲價(jià)潮來襲:內(nèi)存供需失衡,AI硬件成本攀升

據(jù)行業(yè)報(bào)告,英偉達(dá)與AMD預(yù)計(jì)自2026年第一季度起分階段上調(diào)消費(fèi)級(jí)顯卡價(jià)格。此番波動(dòng)根源在于AI爆發(fā)導(dǎo)致顯存供需嚴(yán)重失衡——算力增長(zhǎng)已顯著超越存儲(chǔ)技術(shù)演進(jìn),使得高帶寬內(nèi)存成為瓶頸。

目前GDDR6/GDDR7需求激增,價(jià)格數(shù)月內(nèi)翻倍,導(dǎo)致顯存在顯卡物料成本中占比超80%。以RTX 5090為例,其美國(guó)售價(jià)已從首發(fā)1999美元攀升至接近4000美元。

 短評(píng):

AI硬件競(jìng)爭(zhēng)焦點(diǎn)已從純算力轉(zhuǎn)向“內(nèi)存帶寬”。然而高端存儲(chǔ)技術(shù)仍由少數(shù)巨頭壟斷,短期難有結(jié)構(gòu)改變。在此背景下,中端顯卡產(chǎn)能收縮,而部分輕量化開源模型憑借更低硬件需求(如RTX 4090即可運(yùn)行),或?qū)⒃诔杀久舾袌?chǎng)景中贏得空間。

② 谷歌TPU專利五年增長(zhǎng)2.7倍:全棧生態(tài)的厚積薄發(fā)

2018至2023年間,谷歌TPU相關(guān)專利數(shù)量增長(zhǎng)2.7倍,2023年申請(qǐng)量近400項(xiàng)。相比之下,亞馬遜、蘋果、微軟同期相關(guān)專利總數(shù)均不及谷歌單年數(shù)量,印證AI芯片市場(chǎng)正由通用GPU向定制化ASIC轉(zhuǎn)移。

TPU憑借能效優(yōu)勢(shì),已成為云服務(wù)商自研芯片首選,預(yù)計(jì)2026年出貨增長(zhǎng)率將超40%。另有消息稱Meta正與谷歌洽談百億級(jí)投資,計(jì)劃于2027年大規(guī)模部署TPU構(gòu)建數(shù)據(jù)中心。

 短評(píng):

從算力層(TPU)到模型層(Gemini等),谷歌已構(gòu)建軟硬件深度協(xié)同的全棧優(yōu)勢(shì)。這種從底層基礎(chǔ)設(shè)施到上層模型能力的全方位布局,使其穩(wěn)坐AI金字塔頂端。即便在智能體等應(yīng)用層尚未完全鋪開,其深厚的技術(shù)儲(chǔ)備與生態(tài)控制力,已為未來競(jìng)爭(zhēng)埋下確定性的注腳。

       原文標(biāo)題 : 大模型日?qǐng)?bào)| 元寶“辱罵”事件折射對(duì)齊困境,模型安全風(fēng)口悄然醞釀

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)