訂閱
糾錯(cuò)
加入自媒體

豆包手機(jī)的“生死劫”:權(quán)限、邊界與生態(tài)

2025-12-09 10:06
聽潮TI
關(guān)注

圖片

豆包碰了誰的奶酪?

文/郭佳哿

編輯/張曉

發(fā)布僅一周時(shí)間,豆包手機(jī)助手就已經(jīng)引來輿論層面的幾輪沖擊。

12月5日,豆包團(tuán)隊(duì)發(fā)布公告,稱為了讓技術(shù)發(fā)展與行業(yè)接受度良性適配,將對(duì)AI操作手機(jī)的能力進(jìn)行“規(guī)范化調(diào)整”。其中包括限制金融類應(yīng)用和部分游戲的使用。

圖片圖/豆包手機(jī)助手官微

此前12月1日,字節(jié)跳動(dòng)豆包團(tuán)隊(duì)發(fā)布豆包手機(jī)助手技術(shù)預(yù)覽版,是在豆包大模型基礎(chǔ)上和手機(jī)廠商在操作系統(tǒng)層面合作的AI助手軟件,并官宣率先落地中興旗下的努比亞M153,這款真正接近“AI手機(jī)”的產(chǎn)品,3499元的價(jià)格一度在二級(jí)市場炒至萬元高價(jià)。

隨后不少業(yè)內(nèi)人士抨擊,豆包擁有的跨應(yīng)用操作能力,是因?yàn)楂@取了一項(xiàng)操作系統(tǒng)高危權(quán)限INJECT_EVENTS,直接引來抖音副總裁李亮的公開發(fā)聲:“只要是用戶許可就不存在侵犯隱私的行為。豆包手機(jī)助手是經(jīng)過用戶授權(quán),才能完成操作手機(jī)的任務(wù)”。

圖片圖/@抖音集團(tuán)李亮個(gè)人微博

短短一周,這一系列喧囂不僅將系統(tǒng)級(jí)AI推上風(fēng)口,也讓外界看清了AI Agent在終端上的潛力與局限——讓每個(gè)用戶真正擁有自己的“賈維斯”,遠(yuǎn)比想象中要難。

01

一個(gè)無限接近AI Agent的產(chǎn)品

豆包手機(jī)助手的直觀功能并不復(fù)雜。

除了基礎(chǔ)的多模態(tài)能力和本地工具調(diào)用,它最核心的能力其實(shí)是跨應(yīng)用自動(dòng)執(zhí)行和全局記憶功能。

在豆包最早發(fā)布的演示視頻中,在不同電商平臺(tái)比價(jià)下單、調(diào)取用戶放進(jìn)微信、小紅書、大眾點(diǎn)評(píng)等App收藏夾的地點(diǎn),并在地圖上進(jìn)行標(biāo)注,都是典型案例。

類似早期單個(gè)AI搜索軟件中的上下文感知能力,豆包手機(jī)助手的全局記憶相當(dāng)于把這種記憶能力擴(kuò)展到用戶平時(shí)對(duì)手機(jī)的所有操作上:你保存的某個(gè)日程、關(guān)注的某家餐廳、記錄的某人生日,全局記憶讓助手能夠把分散在不同應(yīng)用或時(shí)間點(diǎn)的任務(wù)整合在一起,實(shí)現(xiàn)跨應(yīng)用的連續(xù)操作,比如通過喚醒記憶幫你訂餐廳、訂機(jī)票等。

如果說早期的豆包像個(gè)聰明的語音助手,如今卻更接近直接把你的秘書塞進(jìn)了系統(tǒng)里。它能理解屏幕內(nèi)容、判斷界面狀態(tài)、自己尋找任務(wù)路徑,而非依賴某個(gè)插件或API。以往的語音助手只是替你發(fā)出指令,豆包開始替你實(shí)際“動(dòng)手”。

某種程度來說,它其實(shí)是一個(gè)無限接近AI Agent的產(chǎn)品。

但從技術(shù)層面來看,豆包手機(jī)助手的核心功能邏輯不外乎兩部分:讀取屏幕+模擬用戶操作。

即它可以通過操作系統(tǒng)提供的無障礙接口獲取當(dāng)前屏幕的界面結(jié)構(gòu)和元素信息,換句話說,它能“看到”屏幕上每個(gè)可交互元素的位置、屬性和文本信息。

圖片圖/豆包手機(jī)助手官網(wǎng)

事實(shí)上,這種功能并不新鮮,大多數(shù)安卓手機(jī)早期的無障礙功能就已經(jīng)可以讀屏并控制應(yīng)用了——一種最初設(shè)計(jì)給視障用戶的系統(tǒng)權(quán)限。區(qū)別在于豆包手機(jī)助手本質(zhì)是把AI大模型做成系統(tǒng)級(jí)的手機(jī)助手,預(yù)裝在手機(jī)里,以最高權(quán)限直接插進(jìn)系統(tǒng),讓操作不再只是機(jī)械執(zhí)行,而是可以根據(jù)上下文和任務(wù)目標(biāo)自主判斷和規(guī)劃,從而完成更復(fù)雜、跨應(yīng)用的自動(dòng)化任務(wù)。

這種產(chǎn)品模式看起來確實(shí)性感,如果是過去的手機(jī)是“你點(diǎn)”,語音助手是“你說,我?guī)湍愦蜷_”;那現(xiàn)在就是“你說,我整個(gè)事情全部做好”。

說到底,這從用戶體驗(yàn)上是質(zhì)變,但從技術(shù)底座上,只是量變的疊加,并沒有顛覆性的底層技術(shù)突破。

那問題來了:這套能力為什么現(xiàn)在才出現(xiàn)?

一方面,大模型的多模態(tài)理解能力在這兩年提升明顯,另一方面,推理成本下降,讓模型常駐后臺(tái)變得現(xiàn)實(shí),不再像過去那樣昂貴、卡頓甚至不穩(wěn)定。

這個(gè)節(jié)點(diǎn)落在2024年底,模型能力、算力成本與用戶需求共同逼近閾值,用戶場景開始成為AI大模型們的共同目標(biāo)。豆包踩中了這樣一個(gè)窗口,它與其他AI產(chǎn)品的關(guān)鍵區(qū)別并不在算力水平,而在于其把錨點(diǎn)瞄準(zhǔn)更與用戶息息相關(guān)的移動(dòng)終端——手機(jī)。

豆包手機(jī)助手的出現(xiàn),顯然不是為了證明技術(shù)實(shí)力,而是為了占據(jù)這個(gè)潛在的超級(jí)入口。在應(yīng)用增長見頂、內(nèi)容平臺(tái)競爭白熱化的當(dāng)下,“入口”比“功能”重要得多。一旦模型能穩(wěn)當(dāng)?shù)爻袚?dān)跨應(yīng)用執(zhí)行任務(wù),它就擁有了重新分配移動(dòng)生態(tài)流量的可能性。

同時(shí)隨著App越做越復(fù)雜、生態(tài)越來越臃腫,用戶被擠壓的耐心反而催生了對(duì)“簡單直接快速”的渴望,整個(gè)手機(jī)行業(yè)給AI讓出了一個(gè)可被替換的鏈路。

這也解釋了為什么豆包手機(jī)助手在短時(shí)間內(nèi)激起如此多討論:它觸碰的不只是產(chǎn)品,而是互聯(lián)網(wǎng)大廠們多年構(gòu)建起的底層生態(tài)。而下一步能否走下去,要看它如何穿越更復(fù)雜的生態(tài)摩擦。

02

核心應(yīng)用們的集體圍剿

輿論的導(dǎo)火索始于微信對(duì)豆包手機(jī)助手的突然“隔離”。

僅正式發(fā)布一天,就陸續(xù)有用戶發(fā)現(xiàn),在使用這臺(tái)搭載了豆包手機(jī)助手的手機(jī)操作微信時(shí),直接觸發(fā)了微信“登錄環(huán)境異常”提示,導(dǎo)致微信被強(qiáng)制下線且無法正常登錄。

緊接著阿里系也緊跟其后,有用戶反饋在登錄淘寶、閑魚、大麥等App時(shí),也遭到了強(qiáng)彈窗提醒,被強(qiáng)制推出并顯示登陸環(huán)境異常,要求更換設(shè)備重新登陸。與此同時(shí),該手機(jī)上的農(nóng)業(yè)銀行、建設(shè)銀行等App也被直接拒絕登陸。

這些核心應(yīng)用的罷工,讓這臺(tái)在二手市場溢價(jià)已經(jīng)高達(dá)近4倍的努比亞工程機(jī),短短幾天內(nèi)直接變成一塊“磚頭”。

雖然對(duì)此微信方的公開回復(fù)是,“沒有什么特別的動(dòng)作,可能是觸發(fā)了本來就有的安全風(fēng)控措施”,但如果把視角拉回到豆包手機(jī)助手本身,它所依賴的系統(tǒng)級(jí)權(quán)限正是這些風(fēng)控敏感的關(guān)鍵所在。

要實(shí)現(xiàn)“像人一樣操作其他應(yīng)用”,AI助手必須獲得較高權(quán)限或廠商級(jí)接入,尤其是連續(xù)跨應(yīng)用調(diào)用會(huì)觸及大量第三方數(shù)據(jù),包括聊天記錄、聯(lián)系人、支付信息等等,這些個(gè)人信息都需要非常明確的用戶授權(quán)、最小權(quán)限原則、以及本地化數(shù)據(jù)保護(hù)。

而AI Agent在真實(shí)環(huán)境中面對(duì)App版本迭代、網(wǎng)絡(luò)波動(dòng)等復(fù)雜情況,一旦出現(xiàn)執(zhí)行失敗或誤操作,尤其涉及支付等重要設(shè)置時(shí),用戶容錯(cuò)成本極高。

這不僅關(guān)乎用戶數(shù)據(jù)安全,也關(guān)系到產(chǎn)品的穩(wěn)定性和風(fēng)控體系完整性。對(duì)微信而言,每一次消息發(fā)送、每一個(gè)操作流程,都嵌入了復(fù)雜的反作弊、反濫用和數(shù)據(jù)監(jiān)控邏輯,一旦被外部工具繞開,就可能打亂系統(tǒng)設(shè)計(jì),增加異常事件和責(zé)任歸屬風(fēng)險(xiǎn)。

值得注意的是,今年4月,微信剛發(fā)布公告提醒用戶切勿使用第三方工具管理微信聊天記錄。此后,包括Siri、小愛同學(xué)、華為小藝等手機(jī)語音助手均無法再通過語音直接調(diào)用微信功能。

圖片圖/微信安全中心官微

這也能解釋為何此次微信動(dòng)作跟進(jìn)得如此迅速的原因,這個(gè)窗口一旦打開,便意味著潛在的濫用可能。對(duì)于微信等核心應(yīng)用,它們必須重新評(píng)估每一個(gè)外部調(diào)用行為的安全性與可信度,這也是為何會(huì)選擇直接阻斷的原因。

這種擔(dān)心并非微信獨(dú)有。對(duì)整個(gè)App生態(tài)而言,當(dāng)外部助手掌握了系統(tǒng)級(jí)操作能力,就意味著任何應(yīng)用的控制權(quán)都有可能被分流或代替。

這也是豆包手機(jī)助手面臨的行業(yè)級(jí)矛盾:入口之爭必然帶來動(dòng)作邊界之爭。

用戶想象中的“便利”,對(duì)應(yīng)用開發(fā)者而言可能是潛在的安全漏洞或者運(yùn)營風(fēng)險(xiǎn)。無論是社交、支付還是電商應(yīng)用,每一次操作都可能牽扯到賬戶安全、交易完整性、用戶體驗(yàn)等多重考量。

從市場角度看,這類限制也揭示了決策權(quán)的歸屬——無論系統(tǒng)權(quán)限多么高,最終能否執(zhí)行任務(wù),取決于App是否允許。

即使系統(tǒng)層的AI助手具備多高的系統(tǒng)權(quán)限,最終能否真正執(zhí)行任務(wù),仍要看各個(gè)App是否在業(yè)務(wù)鏈路、相應(yīng)接口與風(fēng)控體系上給予“可被自動(dòng)化”的空間。如果沒有應(yīng)用方的配合,AI助手的“全局執(zhí)行”就會(huì)遇到天花板。

更廣義地說,這種沖突反映了整個(gè)行業(yè)在系統(tǒng)級(jí)AI入口上的博弈。大廠都希望保留對(duì)用戶操作鏈路的掌控權(quán),因?yàn)檫@是流量、數(shù)據(jù)、風(fēng)控與用戶體驗(yàn)的根基。

一個(gè)簡單的例子,如果豆包這類系統(tǒng)層智能體能夠“代替用戶”在多個(gè)應(yīng)用之間直接執(zhí)行操作,意味著用戶不再需要進(jìn)入各個(gè)平臺(tái)完成這些動(dòng)作。原本打開ABC平臺(tái)→搜索關(guān)鍵詞→瀏覽、比價(jià)商品→完成下單的傳統(tǒng)路徑,變成只需要說一句“幫我買一包50元以內(nèi)、銷量高、明天能送達(dá)的貓糧”,AI助手就會(huì)自動(dòng)去各電商平臺(tái)比價(jià)、選品并完成下單。

用戶不再進(jìn)入平臺(tái)首頁,平臺(tái)就會(huì)失去搜索入口的流量;AI抽取內(nèi)容后,平臺(tái)本身的“推薦流”不再是用戶入口,內(nèi)容價(jià)值鏈被上游截?cái);而用戶瀏覽時(shí)間下降,廣告曝光就會(huì)減少;平臺(tái)的“貨架邏輯”和推薦流量分發(fā)也會(huì)失效。

當(dāng)AI助手嘗試跨越應(yīng)用邊界,它實(shí)際上挑戰(zhàn)的是現(xiàn)有App生態(tài)的權(quán)力分布。豆包手機(jī)助手的嘗試雖然顯示了技術(shù)可行性,但真正能否長期運(yùn)行,取決于能否在在系統(tǒng)權(quán)限與App生態(tài)之間找到商業(yè)操作上的平衡點(diǎn)。

03

軟硬一體才是真正入口

AI發(fā)展了近3年,從算力到多模態(tài)能力,再到AI硬件落地,產(chǎn)業(yè)格局逐漸回到可持續(xù)性商業(yè)模式的考量上。

正如豆包明知跨應(yīng)用自動(dòng)執(zhí)行存在隱私合規(guī)與平臺(tái)關(guān)系的多重風(fēng)險(xiǎn),卻仍要執(zhí)意往前推進(jìn),原因非常直接:跑馬圈地之后,入口之爭進(jìn)入了新的階段,AI 廠商和手機(jī)廠商都意識(shí)到,未來真正能沉淀商業(yè)價(jià)值的,不是一個(gè)個(gè)獨(dú)立的 AI 服務(wù),而是真正與用戶場景相關(guān)的超級(jí)入口。

AI Agent的發(fā)展初期,豆包、元寶、Kimi、通義千問等產(chǎn)品都曾試圖通過嵌入應(yīng)用內(nèi)功能占據(jù)用戶場景。

豆包初期曾嵌入到抖音、今日頭條等應(yīng)用內(nèi),提供智能推薦、內(nèi)容生成等功能;今年初騰訊甚至在微信里幾乎能放廣告的所有地方,都給元寶上了廣告位……

而AI搜索軟件和手機(jī)廠商上一次深度合作還是Deepseek爆火后,華為、榮耀、小米等主流國產(chǎn)手機(jī)廠商都先后宣布在其原有的語音助手中接入DeepSeek。

事實(shí)上,系統(tǒng)級(jí)AI也并非豆包“首發(fā)”。

早在今年6月華為開發(fā)者大會(huì)上,鴻蒙系統(tǒng)6展示的AI智能體驗(yàn),就已出現(xiàn)系統(tǒng)級(jí)AI的雛形,但當(dāng)時(shí)華為強(qiáng)調(diào)的仍是調(diào)度多個(gè)智能體協(xié)同完成任務(wù)。

蘋果方面,Siri正在向系統(tǒng)層執(zhí)行能力升級(jí),未來的Apple Intelligence同樣瞄準(zhǔn)跨App協(xié)作和操作路徑重構(gòu)。小米、華為、OPPO等廠商也在持續(xù)改進(jìn)語音助手的全局操作能力,逐步向中心化、一體化方向靠攏。

硬件端同樣在布局未來入口,從早前的網(wǎng)紅AI穿戴設(shè)備Humane的AI Pin,到阿里在11月最新發(fā)布的夸克AI眼鏡,都曾被視作可能的替代入口。但至少目前尚未獲得用戶心智占領(lǐng),手機(jī)仍是最穩(wěn)定、使用頻次最高的終端。因此,大部分廠商仍將手機(jī)作為核心入口下注。

這也是為什么各大廠在AI生態(tài)布局中,軟硬件同步推進(jìn):軟件確保系統(tǒng)級(jí)操作能力落地,硬件探索未來交互形態(tài),二者結(jié)合才可能形成對(duì)用戶行為路徑的長期控制。

AI的洪流滾滾向前,當(dāng)技術(shù)變得愈加通用,企業(yè)要么上車,要么被拋棄。

頭圖/豆包AI生成

       原文標(biāo)題 : 豆包手機(jī)的“生死劫”:權(quán)限、邊界與生態(tài)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)