訂閱
糾錯
加入自媒體

華為入局Coding Agent,Anthropic揭開AI“人格”之謎

01

重大發(fā)布(新模型/產(chǎn)品/開源)

① 智譜開源輕量模型GLM-4.7-Flash,免費開放使用

智譜團隊今天正式推出新一代輕量模型 GLM-4.7-Flash,并宣布開源且免費開放接口調(diào)用。該模型采用“混合思考”架構(gòu),總參數(shù)300億,實際運行中僅激活30億參數(shù),在確保高性能的同時大幅降低了運算成本。

智譜

在多項測試中,GLM-4.7-Flash 與當前兩款主流輕量開源模型對比,在包括編程評測基準SWE-Bench在內(nèi)的七項測試中,有六項取得領(lǐng)先成績。其在編程、中文寫作、翻譯、長文本理解與角色扮演等實用場景中表現(xiàn)突出。

即日起,開發(fā)者可通過智譜開放平臺免費調(diào)用該模型接口,也可在Hugging Face與魔搭社區(qū)獲取開源版本,F(xiàn)有的GLM-4.5-Flash免費版將于1月30日下線,請求將自動遷移至新版。

短評:

智譜此次開源的定位很清晰——“小而強”,測試成績也印證了這一點。免費且開源的策略大幅降低了中小企業(yè)與開發(fā)者的使用門檻,也為中文場景提供了可自行部署的高性能模型選擇。當前AI應用逐漸落地,企業(yè)往往更關(guān)注任務(wù)成本與效率,而非一味追求參數(shù)規(guī)模。輕量模型更適合嵌入智能體或作為工具鏈的一環(huán),這也是AI工程化的大勢所趨。

② 華為云推出免費代碼助手CodeArts Doer個人版

華為云近日發(fā)布 CodeArts Doer 代碼智能體個人版,面向所有開發(fā)者免費開放。該產(chǎn)品定位為“AI原生編碼助手”,不止能補全代碼,更致力于成為融入開發(fā)全流程的智能協(xié)作者。

華為

其核心功能圍繞三個方面構(gòu)建:

AI IDE:以AI為核心理念打造的開發(fā)環(huán)境,將需求分析、任務(wù)拆解、接口設(shè)計到代碼生成整合在一個界面中,開發(fā)者用自然語言描述需求即可自動生成代碼。

智能編程模式:提供“探索模式”快速驗證想法,以及“規(guī)范模式”確保代碼符合標準與安全規(guī)范。

代碼庫深度理解:可理解百萬行規(guī)模的代碼倉庫,梳理模塊依賴與業(yè)務(wù)邏輯,幫助團隊新人快速上手、提升協(xié)作效率。

據(jù)官方介紹,該工具在項目級代碼生成等場景中,平均可減少30%以上的重復編碼工作。個人版已上線,支持選用GLM-4.7和DeepSeek-V3.2兩種模型,企業(yè)版計劃尚未公布。

短評:

CodeArts Doer展現(xiàn)了華為在AI原生研發(fā)工具鏈上的布局。但目前代碼生成類工具缺乏公認的評測體系,華為也未公布具體量化對比,實際效果還需觀察。此外,當前支持模型有限,生態(tài)開放度不足,可能影響開發(fā)者采納。近一個月國內(nèi)已有多款同類產(chǎn)品上市,競爭日趨同質(zhì)化,CodeArts Doer需展現(xiàn)明顯技術(shù)差異或場景優(yōu)勢才能真正脫穎而出。

③ 階躍星辰AI桌面助手推出Windows版

繼去年9月發(fā)布Mac版后,階躍星辰近日正式推出 AI桌面伙伴Windows版,將智能助手能力擴展至Windows平臺。該產(chǎn)品定位為“會做事、總在場、有記憶、能進化”的本地AI助手。

階躍

本次升級主要帶來以下功能:

支持調(diào)用第三方工具:通過MCP協(xié)議,可操作Excel、QQ郵箱、飛書、釘釘、Notion、高德地圖等16款常用軟件,用戶也可自行接入其他工具,實現(xiàn)如“讀取工資表并群發(fā)郵件”等自動化任務(wù)。

全局記憶(目前僅Mac支持):自動記錄電腦操作軌跡,生成每日摘要,所有數(shù)據(jù)僅存于本地。

窗口內(nèi)容識別(Mac已支持):點擊懸浮球可識別當前窗口內(nèi)容并同步上下文。Windows版已上線基礎(chǔ)功能,高級特性將逐步開放。

短評:

與多數(shù)國內(nèi)廠商聚焦手機助手不同,階躍星辰選擇了與Anthropic Cowork類似的PC端路線。由于Windows/macOS系統(tǒng)開放度更高,AI助手可通過API和腳本實現(xiàn)跨應用操作,更貼合生產(chǎn)力場景中多任務(wù)、長流程的需求。

階躍星辰通過MCP協(xié)議,無需各大廠商單獨授權(quán),即可讓AI安全、結(jié)構(gòu)化地調(diào)用各類軟件,真正打通工作流,解決跨生態(tài)自動化難題,這一選擇顯得更為務(wù)實且具差異化。

02

技術(shù)進展(論文/SOTA/算法)

① Anthropic提出“助手軸”:AI也有“人格”,而且會漂移

Anthropic與牛津大學團隊近日發(fā)布論文《助手軸:定位與穩(wěn)定語言模型的默認人格》。研究發(fā)現(xiàn),經(jīng)過指令調(diào)優(yōu)的大語言模型所呈現(xiàn)的“有用且無害的AI助手”形象,在模型的數(shù)學表示中對應一個明確的“方向”,團隊將其命名為 “助手軸”。

但這種“助手”狀態(tài)并不穩(wěn)定。在面對特定對話情景(如情感傾訴、涉及AI意識的討論)或惡意引導時,模型會發(fā)生 “人格漂移” ,脫離助手軸,進而產(chǎn)生有害或怪異回答。為解決這一問題,研究團隊采用 “激活截斷” 方法,將模型在助手軸上的激活值限制在正常區(qū)間,可在不影響能力的前提下顯著降低有害行為。

研究首先繪制了模型的“人格地圖”,提取模型扮演不同角色(如程序員、幽靈)時的數(shù)學向量,分析發(fā)現(xiàn)最主要的差異維度就是“像助手”與“不像助手”。有趣的是,“助手軸”在未經(jīng)過調(diào)優(yōu)的原始模型中就已存在,說明AI助手的人格并非無中生有,而是建立在預訓練階段學到的“樂于助人的專業(yè)人士”概念之上。

論文同時指出,在多輪對話中,某些高風險話題(如情感脆弱提問、哲學性質(zhì)詢)極易引發(fā)人格漂移,而編程、寫作等明確任務(wù)則有助于保持助手狀態(tài)。通過僅在其偏離時進行輕量干預,新方法在幾乎不影響模型性能的情況下,將有害回答率降低約60%。

短評:

過去AI的失控事件常被籠統(tǒng)歸因為“對齊失敗”,而Anthropic的研究首次指出:大模型在對話中會沿著可測量的“人格空間”移動,一旦偏離“助手軸”,就可能產(chǎn)生幻覺或危險輸出。這并非隨機錯誤,而是模型內(nèi)部結(jié)構(gòu)的自然體現(xiàn)。

當前主流對齊方法(如RLHF)多側(cè)重于訓練末期“鎖定”助手人格,卻難以保障其在長對話中的穩(wěn)定性。Anthropic的工作將AI安全機制從黑箱中揭示出一角,不僅解釋了以往諸多異常案例,也為未來構(gòu)建運行時監(jiān)控與干預系統(tǒng)提供了新思路。

03商業(yè)動態(tài)(融資/合作/財報)

① 鄭欽文代言阿里通義千問,市場反響兩極

1月19日晚,阿里通義千問團隊宣布與中國網(wǎng)球運動員鄭欽文達成全球品牌代言合作,并在B站同步發(fā)布三條宣傳片。官方稱,鄭欽文“迎難而上、解決問題”的體育精神與千問APP“回答聰明、會辦事”的定位相符;“千問”與“欽文”諧音,亦構(gòu)成巧妙的品牌聯(lián)想。

然而市場反響呈現(xiàn)兩極。盡管有一條視頻播放量破百萬,但評論數(shù)寥寥,互動率偏低。部分用戶認可體育代言有助于提升AI產(chǎn)品在大眾尤其是非科技人群中的認知度;但也有不少技術(shù)社區(qū)用戶提出質(zhì)疑,認為阿里更應聚焦于產(chǎn)品與技術(shù)本身的提升。

短評:

阿里此次動作顯示其正從技術(shù)層面向應用與市場層面加速推進,意圖搶占C端AI市場。不過,當前該賽道已有字節(jié)跳動的豆包等產(chǎn)品憑借多模態(tài)體驗占據(jù)用戶心智,阿里千問的定位相對模糊,僅靠明星代言恐難形成突破。在競爭日趨激烈的AI應用市場,產(chǎn)品力與用戶體驗仍是立足之本。

       原文標題 : 華為入局Coding Agent,Anthropic揭開AI“人格”之謎

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號