123,123

華為入局Coding Agent，Anthropic揭開AI“人格”之謎

2026-01-21 13:41

重大發(fā)布（新模型/產(chǎn)品/開源）

① 智譜開源輕量模型GLM-4.7-Flash，免費開放使用

智譜團隊今天正式推出新一代輕量模型 GLM-4.7-Flash，并宣布開源且免費開放接口調(diào)用。該模型采用“混合思考”架構(gòu)，總參數(shù)300億，實際運行中僅激活30億參數(shù)，在確保高性能的同時大幅降低了運算成本。

在多項測試中，GLM-4.7-Flash 與當前兩款主流輕量開源模型對比，在包括編程評測基準SWE-Bench在內(nèi)的七項測試中，有六項取得領(lǐng)先成績。其在編程、中文寫作、翻譯、長文本理解與角色扮演等實用場景中表現(xiàn)突出。

即日起，開發(fā)者可通過智譜開放平臺免費調(diào)用該模型接口，也可在Hugging Face與魔搭社區(qū)獲取開源版本�，F(xiàn)有的GLM-4.5-Flash免費版將于1月30日下線，請求將自動遷移至新版。

短評：

智譜此次開源的定位很清晰——“小而強”，測試成績也印證了這一點。免費且開源的策略大幅降低了中小企業(yè)與開發(fā)者的使用門檻，也為中文場景提供了可自行部署的高性能模型選擇。當前AI應用逐漸落地，企業(yè)往往更關(guān)注任務(wù)成本與效率，而非一味追求參數(shù)規(guī)模。輕量模型更適合嵌入智能體或作為工具鏈的一環(huán)，這也是AI工程化的大勢所趨。

② 華為云推出免費代碼助手CodeArts Doer個人版

華為云近日發(fā)布 CodeArts Doer 代碼智能體個人版，面向所有開發(fā)者免費開放。該產(chǎn)品定位為“AI原生編碼助手”，不止能補全代碼，更致力于成為融入開發(fā)全流程的智能協(xié)作者。

其核心功能圍繞三個方面構(gòu)建：

AI IDE：以AI為核心理念打造的開發(fā)環(huán)境，將需求分析、任務(wù)拆解、接口設(shè)計到代碼生成整合在一個界面中，開發(fā)者用自然語言描述需求即可自動生成代碼。

智能編程模式：提供“探索模式”快速驗證想法，以及“規(guī)范模式”確保代碼符合標準與安全規(guī)范。

代碼庫深度理解：可理解百萬行規(guī)模的代碼倉庫，梳理模塊依賴與業(yè)務(wù)邏輯，幫助團隊新人快速上手、提升協(xié)作效率。

據(jù)官方介紹，該工具在項目級代碼生成等場景中，平均可減少30%以上的重復編碼工作。個人版已上線，支持選用GLM-4.7和DeepSeek-V3.2兩種模型，企業(yè)版計劃尚未公布。

短評：

CodeArts Doer展現(xiàn)了華為在AI原生研發(fā)工具鏈上的布局。但目前代碼生成類工具缺乏公認的評測體系，華為也未公布具體量化對比，實際效果還需觀察。此外，當前支持模型有限，生態(tài)開放度不足，可能影響開發(fā)者采納。近一個月國內(nèi)已有多款同類產(chǎn)品上市，競爭日趨同質(zhì)化，CodeArts Doer需展現(xiàn)明顯技術(shù)差異或場景優(yōu)勢才能真正脫穎而出。

③ 階躍星辰AI桌面助手推出Windows版

繼去年9月發(fā)布Mac版后，階躍星辰近日正式推出 AI桌面伙伴Windows版，將智能助手能力擴展至Windows平臺。該產(chǎn)品定位為“會做事、總在場、有記憶、能進化”的本地AI助手。

本次升級主要帶來以下功能：

支持調(diào)用第三方工具：通過MCP協(xié)議，可操作Excel、QQ郵箱、飛書、釘釘、Notion、高德地圖等16款常用軟件，用戶也可自行接入其他工具，實現(xiàn)如“讀取工資表并群發(fā)郵件”等自動化任務(wù)。

全局記憶（目前僅Mac支持）：自動記錄電腦操作軌跡，生成每日摘要，所有數(shù)據(jù)僅存于本地。

窗口內(nèi)容識別（Mac已支持）：點擊懸浮球可識別當前窗口內(nèi)容并同步上下文。Windows版已上線基礎(chǔ)功能，高級特性將逐步開放。

短評：

與多數(shù)國內(nèi)廠商聚焦手機助手不同，階躍星辰選擇了與Anthropic Cowork類似的PC端路線。由于Windows/macOS系統(tǒng)開放度更高，AI助手可通過API和腳本實現(xiàn)跨應用操作，更貼合生產(chǎn)力場景中多任務(wù)、長流程的需求。

階躍星辰通過MCP協(xié)議，無需各大廠商單獨授權(quán)，即可讓AI安全、結(jié)構(gòu)化地調(diào)用各類軟件，真正打通工作流，解決跨生態(tài)自動化難題，這一選擇顯得更為務(wù)實且具差異化。

技術(shù)進展（論文/SOTA/算法）

① Anthropic提出“助手軸”：AI也有“人格”，而且會漂移

Anthropic與牛津大學團隊近日發(fā)布論文《助手軸：定位與穩(wěn)定語言模型的默認人格》。研究發(fā)現(xiàn)，經(jīng)過指令調(diào)優(yōu)的大語言模型所呈現(xiàn)的“有用且無害的AI助手”形象，在模型的數(shù)學表示中對應一個明確的“方向”，團隊將其命名為 “助手軸”。

但這種“助手”狀態(tài)并不穩(wěn)定。在面對特定對話情景（如情感傾訴、涉及AI意識的討論）或惡意引導時，模型會發(fā)生 “人格漂移” ，脫離助手軸，進而產(chǎn)生有害或怪異回答。為解決這一問題，研究團隊采用 “激活截斷” 方法，將模型在助手軸上的激活值限制在正常區(qū)間，可在不影響能力的前提下顯著降低有害行為。

研究首先繪制了模型的“人格地圖”，提取模型扮演不同角色（如程序員、幽靈）時的數(shù)學向量，分析發(fā)現(xiàn)最主要的差異維度就是“像助手”與“不像助手”。有趣的是，“助手軸”在未經(jīng)過調(diào)優(yōu)的原始模型中就已存在，說明AI助手的人格并非無中生有，而是建立在預訓練階段學到的“樂于助人的專業(yè)人士”概念之上。

論文同時指出，在多輪對話中，某些高風險話題（如情感脆弱提問、哲學性質(zhì)詢）極易引發(fā)人格漂移，而編程、寫作等明確任務(wù)則有助于保持助手狀態(tài)。通過僅在其偏離時進行輕量干預，新方法在幾乎不影響模型性能的情況下，將有害回答率降低約60%。

短評：

過去AI的失控事件常被籠統(tǒng)歸因為“對齊失敗”，而Anthropic的研究首次指出：大模型在對話中會沿著可測量的“人格空間”移動，一旦偏離“助手軸”，就可能產(chǎn)生幻覺或危險輸出。這并非隨機錯誤，而是模型內(nèi)部結(jié)構(gòu)的自然體現(xiàn)。

當前主流對齊方法（如RLHF）多側(cè)重于訓練末期“鎖定”助手人格，卻難以保障其在長對話中的穩(wěn)定性。Anthropic的工作將AI安全機制從黑箱中揭示出一角，不僅解釋了以往諸多異常案例，也為未來構(gòu)建運行時監(jiān)控與干預系統(tǒng)提供了新思路。

03商業(yè)動態(tài)（融資/合作/財報）

① 鄭欽文代言阿里通義千問，市場反響兩極

1月19日晚，阿里通義千問團隊宣布與中國網(wǎng)球運動員鄭欽文達成全球品牌代言合作，并在B站同步發(fā)布三條宣傳片。官方稱，鄭欽文“迎難而上、解決問題”的體育精神與千問APP“回答聰明、會辦事”的定位相符；“千問”與“欽文”諧音，亦構(gòu)成巧妙的品牌聯(lián)想。

然而市場反響呈現(xiàn)兩極。盡管有一條視頻播放量破百萬，但評論數(shù)寥寥，互動率偏低。部分用戶認可體育代言有助于提升AI產(chǎn)品在大眾尤其是非科技人群中的認知度；但也有不少技術(shù)社區(qū)用戶提出質(zhì)疑，認為阿里更應聚焦于產(chǎn)品與技術(shù)本身的提升。

短評：

阿里此次動作顯示其正從技術(shù)層面向應用與市場層面加速推進，意圖搶占C端AI市場。不過，當前該賽道已有字節(jié)跳動的豆包等產(chǎn)品憑借多模態(tài)體驗占據(jù)用戶心智，阿里千問的定位相對模糊，僅靠明星代言恐難形成突破。在競爭日趨激烈的AI應用市場，產(chǎn)品力與用戶體驗仍是立足之本。

原文標題 : 華為入局Coding Agent，Anthropic揭開AI“人格”之謎