訂閱
糾錯(cuò)
加入自媒體

大模型日?qǐng)?bào)|中國(guó)大模型第一股IPO倒計(jì)時(shí),阿里通義推出自己的手機(jī)管家

圖片

01

重大發(fā)布(新模型/產(chǎn)品/開源)

①ChatGPT手機(jī)版更新:切換“標(biāo)準(zhǔn)思考”與“擴(kuò)展思考”

12月29日,OpenAI對(duì)安卓端的ChatGPT進(jìn)行更新,允許手機(jī)用戶設(shè)置模型的思考深度,在“Standard Thinking(標(biāo)準(zhǔn)思考)”和“Extended Thinking(擴(kuò)展思考)”中進(jìn)行切換。

在此之前,由于算力訪問限制,手機(jī)端用戶只能使用標(biāo)準(zhǔn)思考模式,無法進(jìn)行長(zhǎng)時(shí)間的深度推理,一定程度上限制了其實(shí)用性。與此同時(shí),PC端的UI界面也得到了布局上的優(yōu)化。不過,經(jīng)過更新后,仍然只有Plus級(jí)別以上的訂閱會(huì)員才能享受到這些權(quán)限。

作為對(duì)比,OpenAI目前的最大競(jìng)爭(zhēng)對(duì)手Google Gemini的手機(jī)端和PC端都早已具備這一功能,免費(fèi)版用戶即可使用,UI界面清晰。

(Gemini手機(jī)端)

(Gemini PC端)

短評(píng):允許龐大的手機(jī)端用戶群體使用更深度的推理服務(wù)證明OpenAI的算力變得更加充足,界面的優(yōu)化也有助于改善現(xiàn)有用戶的使用體驗(yàn)。但對(duì)于技術(shù)層面已經(jīng)沒有領(lǐng)先優(yōu)勢(shì)的OpenAI來說,維持現(xiàn)有用戶的活躍度遠(yuǎn)遠(yuǎn)不夠,諸如此類的小型更新無法拉新,GPT-5.2的大型更新又“差評(píng)如潮”。這也印證了先前的判斷:OpenAI在做的事情是“別人有的我們也要有”,而不是“我們做了別人沒有的”。

②雙端同步+定時(shí)提醒,騰訊元寶上線任務(wù)功能

騰訊的元寶同樣迎來了一次產(chǎn)品功能的迭代:手機(jī)端和電腦端同步添加了任務(wù)功能,用戶僅通過一句話就可以設(shè)置循環(huán)定時(shí)任務(wù),讓AI幫忙記事、提醒甚至是陪聊。

這次功能更新看似簡(jiǎn)單,但也表明騰訊正在把元寶“問答工具”的定位修改為“日常陪伴型AI”,通過人們生活中高頻且剛需的定時(shí)任務(wù),讓用戶生態(tài)進(jìn)一步牢固。

831c6bfea644fc35eb8dc1fbaf6d962a

根據(jù)產(chǎn)品功能描述,任務(wù)功能需要讓AI完成以下流程:理解模糊的指令、生成可執(zhí)行的計(jì)劃、跨端側(cè)同步以及在提醒后繼續(xù)對(duì)話。因此,AI需要具備不僅限于以下技術(shù)能力:

一是根據(jù)“一句話”生成結(jié)構(gòu)化的計(jì)劃:用戶為了方便,給出的指令往往是模糊的,但AI則需要精確完成時(shí)間抽取、意圖分類、動(dòng)作生成等關(guān)鍵環(huán)節(jié);

二是任務(wù)的持久化存儲(chǔ),并在手機(jī)端和PC端實(shí)現(xiàn)同步,這就需要輕量級(jí)的用戶任務(wù)數(shù)據(jù)庫(kù);而提醒的觸發(fā)則需要后臺(tái)具備調(diào)度服務(wù)的功能;

三是具備上下文記憶,這也是AI普遍面臨的一大問題,AI要實(shí)現(xiàn)提醒后繼續(xù)陪聊就必須配備更大的上下文窗口,以實(shí)現(xiàn)任務(wù)狀態(tài)的記憶、動(dòng)態(tài)響應(yīng)和多輪對(duì)話的管理。

短評(píng):

騰訊的用戶基數(shù)毋庸置疑,元寶誕生在這個(gè)溫床中具備非常大的競(jìng)爭(zhēng)優(yōu)勢(shì)。不過,雖然任務(wù)功能的上線蘊(yùn)含不少技術(shù)層面上的提升,但對(duì)于財(cái)大氣粗的騰訊來說,其AI研發(fā)進(jìn)度仍然略顯緩慢。

02

技術(shù)進(jìn)展(論文/SOTA/算法)

①通義MAI-UI開源:首個(gè)通用GUI智能體基座直接刷新SOTA紀(jì)錄

前段時(shí)間,豆包手機(jī)助手在互聯(lián)網(wǎng)上掀起風(fēng)浪,引起了騰訊、阿里等科技巨頭公司的警惕。

如今,阿里通義團(tuán)隊(duì)也推出了自己的手機(jī)管家,其開源的MAI-UI宣稱為全球首個(gè)面向“真實(shí)手機(jī)生活”的通用GUI智能體基座模型,并在5項(xiàng)權(quán)威性測(cè)試(如Android World和MobileWorld等)中全部登頂SOTA,戰(zhàn)勝了以Gemini為首的國(guó)際領(lǐng)先大模型。

項(xiàng)目地址:https://github.com/Tongyi-MAI/MAI-UI

根據(jù)阿里云官方社區(qū)內(nèi)的用戶體驗(yàn)反饋,這一智能體基座模型主要有如下幾個(gè)引人注目的亮點(diǎn):

一是拒絕揣測(cè)用戶意圖,主動(dòng)詢問用戶歸還決策權(quán),避免“自作主張”的現(xiàn)象;

二是能夠調(diào)用API而非“點(diǎn)擊屏幕”,善于使用高德、Github、釘釘?shù)冉Y(jié)構(gòu)化的工具,通過顯著降低操作次數(shù)有效提升了準(zhǔn)確率;

三是實(shí)現(xiàn)了端側(cè)和云側(cè)的分離,日常任務(wù)在手機(jī)端運(yùn)行2B參數(shù)的小型模型即可完成,復(fù)雜任務(wù)則依靠云端的32B大模型完成,支付密碼等隱私操作只在本地運(yùn)行,絕不上傳;

四是強(qiáng)大的抗干擾能力,通過在動(dòng)態(tài)環(huán)境中引入在線強(qiáng)化學(xué)習(xí)機(jī)制,解決手機(jī)環(huán)境中的各種意外狀況。

短評(píng):

字節(jié)的豆包手機(jī)助手發(fā)布僅一天后,騰訊的微信和阿里的淘寶等APP就以安全性為由拒絕其訪問;而阿里的MAI-UI目前能夠調(diào)用的,也只是阿里系的產(chǎn)品(高德、釘釘)和Github等開放平臺(tái)。因此,AI能幫人做事的前提是App愿意“開門”,其行動(dòng)的自由度,仍然與母公司的軟件生態(tài)控制力高度關(guān)聯(lián)。

短期內(nèi),手機(jī)助手類產(chǎn)品仍然只能在特定的生態(tài)環(huán)境中得以流暢運(yùn)行。即便是通過商業(yè)合作等方式實(shí)現(xiàn)了類似淘寶和微信的協(xié)同,銀行這種高風(fēng)險(xiǎn)的政府App也絕不會(huì)輕易開放權(quán)限。因此,AI助手在真實(shí)世界中,目前還“寸步難行”。

②文生圖門檻再降低:FLUX.2 Turbo開源,刷新文生圖速度

今天凌晨,生成式AI媒體平臺(tái)fal開源了名為FLUX.2 [dev] Turbo的文生圖模型,瞬間登頂Artificial Analysis的開源模型排行榜。值得注意的是,阿里的Z-image Turbo在一周前剛剛成為這一榜單的霸主。截至30日下午,F(xiàn)lus.2 [dev] Turbo模型仍位于開源榜第一,全榜第十。

項(xiàng)目地址:https://fal.ai/models/fal-ai/flux-2/turbo

該模型是fal基于Black Forest Labs的FLUX.2 [dev]模型優(yōu)化推出的Turbo版本,主打極快的生成速度,一張高清圖僅需花費(fèi)約5秒,全流程推理步驟從50步壓縮到8步,速度提升超過6倍,且畫面質(zhì)量更加穩(wěn)定可控。

目前這一模型已經(jīng)開放在線免費(fèi)體驗(yàn),但更重要的是:該模型的硬件需求并不高,RTX 4090的用戶即可本地部署并進(jìn)行微調(diào);生成一張1024×1024像素的圖像成本僅為0.008美元,創(chuàng)下文生圖成本最低記錄。

短評(píng):

這一開源文生圖模型的發(fā)布,讓文生圖能力徹底從“大廠提供的收費(fèi)服務(wù)”變成了“人人可用的生產(chǎn)工具”。如此低廉的成本,無異于在宣告AI巨頭們“閉源+高質(zhì)量”路線的終結(jié)。

盡管文生圖在當(dāng)下看來毫無疑問已經(jīng)是賠本買賣,但是當(dāng)此類開源模型大規(guī)模普及后,它就可以搖身一變,成為可編程且易于私有化部署的模型底座,走向工作流和智能體的商業(yè)化路徑。

03

商業(yè)動(dòng)態(tài)(融資/合作/財(cái)報(bào))

①主打“通用智能體”的Manus 被 Meta 收入麾下

今天上午,Manus官方發(fā)布消息:Manus已被Meta收購(gòu)。兩天前,Manus團(tuán)隊(duì)放出的立項(xiàng)初期會(huì)議紀(jì)要中強(qiáng)調(diào)的“通用性”,如今已經(jīng)成功變?yōu)樽畲蟮馁u點(diǎn)。根據(jù)官方數(shù)據(jù),Manus上線至今處理的Tokens超過147萬億,創(chuàng)建了超過8000萬臺(tái)虛擬計(jì)算機(jī),而其三年內(nèi)順利完成四輪融資、兩年內(nèi)估值增長(zhǎng)超過30倍、上限僅9個(gè)月ARR破億等利好消息則已經(jīng)向市場(chǎng)證明:通用智能體具備盈利能力。

盡管Meta的這次收購(gòu)具體交易細(xì)節(jié)尚未公布,但這一舉動(dòng)顯然是為了搶占智能體賽道的入口。事實(shí)上,Meta在先前的AI大模型競(jìng)爭(zhēng)中已經(jīng)處于落后地位,其Llama系列大模型的綜合能力雖然也處于第一梯隊(duì),但與文本領(lǐng)域的巨頭Gemini和GPT系列存在明顯差距,而多模態(tài)領(lǐng)域也被Gemini以及國(guó)內(nèi)字節(jié)的Seedream和阿里的Qwen甩開。因此,Meta沒有在以前的賽道上加速追逐,而是選擇成為“通用性Agent”新賽道的領(lǐng)跑者。

短評(píng):

如此看來,Manus的定位與Meta就顯得極為匹配。Manus也面臨著類似的問題,雖然能夠覆蓋的應(yīng)用范圍較廣,但智能程度無法與頂尖模型競(jìng)爭(zhēng),從消耗的Tokens數(shù)量來看更是與豆包這種“龐然大物”存在數(shù)量級(jí)的差距。

根據(jù)Manus首席執(zhí)行官肖弘的說法,Meta的這次收購(gòu)并不改變Manus的運(yùn)作方式和決策機(jī)制,但若是雙方仍然遵循原先的路徑,恐怕“通用性Agent”市場(chǎng)中的蛋糕很快就會(huì)被分走,畢竟對(duì)于Google和字節(jié)等公司來說,實(shí)現(xiàn)通用性并非技術(shù)難題。“全面但不精通”是Meta與Manus下一步必須解決的問題。

②智譜港股上市:堅(jiān)持AI模型能力的競(jìng)爭(zhēng)

同樣是今天上午,國(guó)產(chǎn)AI初創(chuàng)公司智譜確定了1月8日于港股上市。全球發(fā)售3741.95萬H股,每股發(fā)行價(jià)格116.2港元。

招股書中,智譜對(duì)公司的定義為“中國(guó)領(lǐng)先的人工智能公司,致力于追求通用人工智能(AGI)創(chuàng)新”。目前,智譜的產(chǎn)品體系涵蓋范圍較廣,大語言模型(GLM-4.7)和智能體(AutoGLM)等領(lǐng)域均實(shí)現(xiàn)了一定程度上的覆蓋。

目前,智譜的虧損情況仍然在加重。其2022、2023、2024年和2025年上半年的虧損額分別為1.44億、7.88億、29.58億和23.58億,研發(fā)投入數(shù)額也在不斷增加。不過,值得注意的是,國(guó)內(nèi)AI初創(chuàng)企業(yè)中,仍然能在模型智能化程度上保持競(jìng)爭(zhēng)力的企業(yè)已經(jīng)為數(shù)不多,而智譜則是其中之一:其最新版模型GLM-4.7在Artificial Analysis的榜單中拿下了相當(dāng)不錯(cuò)的成績(jī)。

短評(píng):

作為軟件生態(tài)與硬件資源均面臨限制的國(guó)內(nèi)AI初創(chuàng)企業(yè),在多家AI公司選擇將模型的研發(fā)重點(diǎn)遷移至多模態(tài)的背景下,GLM系列產(chǎn)品能夠與Gemini和GPT保持競(jìng)爭(zhēng)實(shí)屬不易。但是,智譜要面對(duì)的對(duì)手,不僅是國(guó)外這兩大巨頭,國(guó)內(nèi)的阿里、字節(jié)和騰訊也不容忽視。

在大模型領(lǐng)域內(nèi),暫時(shí)還無法確定智譜的核心競(jìng)爭(zhēng)力。但是,開源的AutoGLM則起到了一定的補(bǔ)充作用,Agent成為未來的關(guān)注重點(diǎn)已成事實(shí),智譜開源的基座模型或許會(huì)成為其發(fā)展的堅(jiān)固基石。

       原文標(biāo)題 : 大模型日?qǐng)?bào)|中國(guó)大模型第一股IPO倒計(jì)時(shí),阿里通義推出自己的手機(jī)管家

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)