訂閱
糾錯(cuò)
加入自媒體

華為入局Coding Agent,Anthropic揭開(kāi)AI“人格”之謎

01

重大發(fā)布(新模型/產(chǎn)品/開(kāi)源)

① 智譜開(kāi)源輕量模型GLM-4.7-Flash,免費(fèi)開(kāi)放使用

智譜團(tuán)隊(duì)今天正式推出新一代輕量模型 GLM-4.7-Flash,并宣布開(kāi)源且免費(fèi)開(kāi)放接口調(diào)用。該模型采用“混合思考”架構(gòu),總參數(shù)300億,實(shí)際運(yùn)行中僅激活30億參數(shù),在確保高性能的同時(shí)大幅降低了運(yùn)算成本。

智譜

在多項(xiàng)測(cè)試中,GLM-4.7-Flash 與當(dāng)前兩款主流輕量開(kāi)源模型對(duì)比,在包括編程評(píng)測(cè)基準(zhǔn)SWE-Bench在內(nèi)的七項(xiàng)測(cè)試中,有六項(xiàng)取得領(lǐng)先成績(jī)。其在編程、中文寫(xiě)作、翻譯、長(zhǎng)文本理解與角色扮演等實(shí)用場(chǎng)景中表現(xiàn)突出。

即日起,開(kāi)發(fā)者可通過(guò)智譜開(kāi)放平臺(tái)免費(fèi)調(diào)用該模型接口,也可在Hugging Face與魔搭社區(qū)獲取開(kāi)源版本,F(xiàn)有的GLM-4.5-Flash免費(fèi)版將于1月30日下線,請(qǐng)求將自動(dòng)遷移至新版。

短評(píng):

智譜此次開(kāi)源的定位很清晰——“小而強(qiáng)”,測(cè)試成績(jī)也印證了這一點(diǎn)。免費(fèi)且開(kāi)源的策略大幅降低了中小企業(yè)與開(kāi)發(fā)者的使用門(mén)檻,也為中文場(chǎng)景提供了可自行部署的高性能模型選擇。當(dāng)前AI應(yīng)用逐漸落地,企業(yè)往往更關(guān)注任務(wù)成本與效率,而非一味追求參數(shù)規(guī)模。輕量模型更適合嵌入智能體或作為工具鏈的一環(huán),這也是AI工程化的大勢(shì)所趨。

② 華為云推出免費(fèi)代碼助手CodeArts Doer個(gè)人版

華為云近日發(fā)布 CodeArts Doer 代碼智能體個(gè)人版,面向所有開(kāi)發(fā)者免費(fèi)開(kāi)放。該產(chǎn)品定位為“AI原生編碼助手”,不止能補(bǔ)全代碼,更致力于成為融入開(kāi)發(fā)全流程的智能協(xié)作者。

華為

其核心功能?chē)@三個(gè)方面構(gòu)建:

AI IDE:以AI為核心理念打造的開(kāi)發(fā)環(huán)境,將需求分析、任務(wù)拆解、接口設(shè)計(jì)到代碼生成整合在一個(gè)界面中,開(kāi)發(fā)者用自然語(yǔ)言描述需求即可自動(dòng)生成代碼。

智能編程模式:提供“探索模式”快速驗(yàn)證想法,以及“規(guī)范模式”確保代碼符合標(biāo)準(zhǔn)與安全規(guī)范。

代碼庫(kù)深度理解:可理解百萬(wàn)行規(guī)模的代碼倉(cāng)庫(kù),梳理模塊依賴與業(yè)務(wù)邏輯,幫助團(tuán)隊(duì)新人快速上手、提升協(xié)作效率。

據(jù)官方介紹,該工具在項(xiàng)目級(jí)代碼生成等場(chǎng)景中,平均可減少30%以上的重復(fù)編碼工作。個(gè)人版已上線,支持選用GLM-4.7和DeepSeek-V3.2兩種模型,企業(yè)版計(jì)劃尚未公布。

短評(píng):

CodeArts Doer展現(xiàn)了華為在AI原生研發(fā)工具鏈上的布局。但目前代碼生成類(lèi)工具缺乏公認(rèn)的評(píng)測(cè)體系,華為也未公布具體量化對(duì)比,實(shí)際效果還需觀察。此外,當(dāng)前支持模型有限,生態(tài)開(kāi)放度不足,可能影響開(kāi)發(fā)者采納。近一個(gè)月國(guó)內(nèi)已有多款同類(lèi)產(chǎn)品上市,競(jìng)爭(zhēng)日趨同質(zhì)化,CodeArts Doer需展現(xiàn)明顯技術(shù)差異或場(chǎng)景優(yōu)勢(shì)才能真正脫穎而出。

③ 階躍星辰AI桌面助手推出Windows版

繼去年9月發(fā)布Mac版后,階躍星辰近日正式推出 AI桌面伙伴Windows版,將智能助手能力擴(kuò)展至Windows平臺(tái)。該產(chǎn)品定位為“會(huì)做事、總在場(chǎng)、有記憶、能進(jìn)化”的本地AI助手。

階躍

本次升級(jí)主要帶來(lái)以下功能:

支持調(diào)用第三方工具:通過(guò)MCP協(xié)議,可操作Excel、QQ郵箱、飛書(shū)、釘釘、Notion、高德地圖等16款常用軟件,用戶也可自行接入其他工具,實(shí)現(xiàn)如“讀取工資表并群發(fā)郵件”等自動(dòng)化任務(wù)。

全局記憶(目前僅Mac支持):自動(dòng)記錄電腦操作軌跡,生成每日摘要,所有數(shù)據(jù)僅存于本地。

窗口內(nèi)容識(shí)別(Mac已支持):點(diǎn)擊懸浮球可識(shí)別當(dāng)前窗口內(nèi)容并同步上下文。Windows版已上線基礎(chǔ)功能,高級(jí)特性將逐步開(kāi)放。

短評(píng):

與多數(shù)國(guó)內(nèi)廠商聚焦手機(jī)助手不同,階躍星辰選擇了與Anthropic Cowork類(lèi)似的PC端路線。由于Windows/macOS系統(tǒng)開(kāi)放度更高,AI助手可通過(guò)API和腳本實(shí)現(xiàn)跨應(yīng)用操作,更貼合生產(chǎn)力場(chǎng)景中多任務(wù)、長(zhǎng)流程的需求。

階躍星辰通過(guò)MCP協(xié)議,無(wú)需各大廠商單獨(dú)授權(quán),即可讓AI安全、結(jié)構(gòu)化地調(diào)用各類(lèi)軟件,真正打通工作流,解決跨生態(tài)自動(dòng)化難題,這一選擇顯得更為務(wù)實(shí)且具差異化。

02

技術(shù)進(jìn)展(論文/SOTA/算法)

① Anthropic提出“助手軸”:AI也有“人格”,而且會(huì)漂移

Anthropic與牛津大學(xué)團(tuán)隊(duì)近日發(fā)布論文《助手軸:定位與穩(wěn)定語(yǔ)言模型的默認(rèn)人格》。研究發(fā)現(xiàn),經(jīng)過(guò)指令調(diào)優(yōu)的大語(yǔ)言模型所呈現(xiàn)的“有用且無(wú)害的AI助手”形象,在模型的數(shù)學(xué)表示中對(duì)應(yīng)一個(gè)明確的“方向”,團(tuán)隊(duì)將其命名為 “助手軸”。

但這種“助手”狀態(tài)并不穩(wěn)定。在面對(duì)特定對(duì)話情景(如情感傾訴、涉及AI意識(shí)的討論)或惡意引導(dǎo)時(shí),模型會(huì)發(fā)生 “人格漂移” ,脫離助手軸,進(jìn)而產(chǎn)生有害或怪異回答。為解決這一問(wèn)題,研究團(tuán)隊(duì)采用 “激活截?cái)?rdquo; 方法,將模型在助手軸上的激活值限制在正常區(qū)間,可在不影響能力的前提下顯著降低有害行為。

研究首先繪制了模型的“人格地圖”,提取模型扮演不同角色(如程序員、幽靈)時(shí)的數(shù)學(xué)向量,分析發(fā)現(xiàn)最主要的差異維度就是“像助手”與“不像助手”。有趣的是,“助手軸”在未經(jīng)過(guò)調(diào)優(yōu)的原始模型中就已存在,說(shuō)明AI助手的人格并非無(wú)中生有,而是建立在預(yù)訓(xùn)練階段學(xué)到的“樂(lè)于助人的專業(yè)人士”概念之上。

論文同時(shí)指出,在多輪對(duì)話中,某些高風(fēng)險(xiǎn)話題(如情感脆弱提問(wèn)、哲學(xué)性質(zhì)詢)極易引發(fā)人格漂移,而編程、寫(xiě)作等明確任務(wù)則有助于保持助手狀態(tài)。通過(guò)僅在其偏離時(shí)進(jìn)行輕量干預(yù),新方法在幾乎不影響模型性能的情況下,將有害回答率降低約60%。

短評(píng):

過(guò)去AI的失控事件常被籠統(tǒng)歸因?yàn)?ldquo;對(duì)齊失敗”,而Anthropic的研究首次指出:大模型在對(duì)話中會(huì)沿著可測(cè)量的“人格空間”移動(dòng),一旦偏離“助手軸”,就可能產(chǎn)生幻覺(jué)或危險(xiǎn)輸出。這并非隨機(jī)錯(cuò)誤,而是模型內(nèi)部結(jié)構(gòu)的自然體現(xiàn)。

當(dāng)前主流對(duì)齊方法(如RLHF)多側(cè)重于訓(xùn)練末期“鎖定”助手人格,卻難以保障其在長(zhǎng)對(duì)話中的穩(wěn)定性。Anthropic的工作將AI安全機(jī)制從黑箱中揭示出一角,不僅解釋了以往諸多異常案例,也為未來(lái)構(gòu)建運(yùn)行時(shí)監(jiān)控與干預(yù)系統(tǒng)提供了新思路。

03商業(yè)動(dòng)態(tài)(融資/合作/財(cái)報(bào))

① 鄭欽文代言阿里通義千問(wèn),市場(chǎng)反響兩極

1月19日晚,阿里通義千問(wèn)團(tuán)隊(duì)宣布與中國(guó)網(wǎng)球運(yùn)動(dòng)員鄭欽文達(dá)成全球品牌代言合作,并在B站同步發(fā)布三條宣傳片。官方稱,鄭欽文“迎難而上、解決問(wèn)題”的體育精神與千問(wèn)APP“回答聰明、會(huì)辦事”的定位相符;“千問(wèn)”與“欽文”諧音,亦構(gòu)成巧妙的品牌聯(lián)想。

然而市場(chǎng)反響呈現(xiàn)兩極。盡管有一條視頻播放量破百萬(wàn),但評(píng)論數(shù)寥寥,互動(dòng)率偏低。部分用戶認(rèn)可體育代言有助于提升AI產(chǎn)品在大眾尤其是非科技人群中的認(rèn)知度;但也有不少技術(shù)社區(qū)用戶提出質(zhì)疑,認(rèn)為阿里更應(yīng)聚焦于產(chǎn)品與技術(shù)本身的提升。

短評(píng):

阿里此次動(dòng)作顯示其正從技術(shù)層面向應(yīng)用與市場(chǎng)層面加速推進(jìn),意圖搶占C端AI市場(chǎng)。不過(guò),當(dāng)前該賽道已有字節(jié)跳動(dòng)的豆包等產(chǎn)品憑借多模態(tài)體驗(yàn)占據(jù)用戶心智,阿里千問(wèn)的定位相對(duì)模糊,僅靠明星代言恐難形成突破。在競(jìng)爭(zhēng)日趨激烈的AI應(yīng)用市場(chǎng),產(chǎn)品力與用戶體驗(yàn)仍是立足之本。

       原文標(biāo)題 : 華為入局Coding Agent,Anthropic揭開(kāi)AI“人格”之謎

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)