在A(yíng)I與信息交互之間:QQ 瀏覽器的邊界探索之旅
互聯(lián)網(wǎng)1.0時(shí)代,網(wǎng)絡(luò)是人們查閱資料、了解世界的重要窗口,這個(gè)時(shí)期人與信息的關(guān)系是單向的,信息如一本本靜態(tài)的電子化書(shū)本需要用戶(hù)觸及后再閱覽獲。
互聯(lián)網(wǎng)2.0時(shí)代,互聯(lián)網(wǎng)開(kāi)始成為人們獲取價(jià)值信息和社交不可或缺的重要工具,人與信息的關(guān)系開(kāi)始有了雙向的交互,信息與人共同編織、豐富著這張時(shí)代大網(wǎng)。
隨著推薦技術(shù)成熟以及信息流業(yè)務(wù)急速擴(kuò)張,用戶(hù)與內(nèi)容的交互模式逐漸從“人找內(nèi)容-搜索”向“內(nèi)容找人-推薦”遷移,并且這種趨勢(shì)仍在擴(kuò)大它的外延。搜索作為人與內(nèi)容信息交互的一種重要方式,它的作用并沒(méi)有削弱,用戶(hù)在推薦場(chǎng)景的沉浸消費(fèi)反而會(huì)激發(fā)出新的搜索需求。
從本質(zhì)上看,搜索與推薦關(guān)注的交匯點(diǎn)都是交互的核心——用戶(hù)興趣,因此如何在當(dāng)前信息分發(fā)場(chǎng)景中更好滿(mǎn)足用戶(hù)興趣是一個(gè)重要命題。而瀏覽器是用戶(hù)在互聯(lián)網(wǎng)2.0時(shí)代與世界交互信息的重要入口,也是展示搜索與推薦技術(shù)精進(jìn)的絕佳觀(guān)察點(diǎn)。
瀏覽器作為一款綜合性APP,承載了搜索、信息流推薦、小說(shuō)等多種用戶(hù)消費(fèi)信息的場(chǎng)景。這些場(chǎng)景都有大量的內(nèi)容理解、內(nèi)容生成方面的AI需求。不同的場(chǎng)景都有各自的特點(diǎn),比如搜索的Query意圖分類(lèi)、信息流的內(nèi)容推薦、小說(shuō)的內(nèi)容分類(lèi)等。
這些特點(diǎn)也讓瀏覽器成為全面觀(guān)察AI技術(shù)在自然語(yǔ)言語(yǔ)義理解方向發(fā)展很好的窗口,跟隨推薦技術(shù)的發(fā)展脈絡(luò),我們發(fā)現(xiàn)騰訊旗下的QQ瀏覽器應(yīng)用月活用戶(hù)已經(jīng)超過(guò)4億,儼然成長(zhǎng)為瀏覽器中的超級(jí)APP。
在國(guó)內(nèi),騰訊是較早大規(guī)模實(shí)踐AI推薦技術(shù)的廠(chǎng)商之一,旗下的QQ瀏覽器過(guò)去幾年來(lái)在A(yíng)I和推薦技術(shù)方面經(jīng)歷了幾次大規(guī)模重構(gòu)和迭代,現(xiàn)在已經(jīng)蔚然成森。這幾年QQ 瀏覽器在技術(shù)層經(jīng)歷了怎樣的厚積?在信息繭房和視頻化難題的泥沼中,QQ 瀏覽器做出了哪些選擇?其實(shí)戰(zhàn)經(jīng)歷對(duì)于瀏覽器行業(yè)來(lái)說(shuō),還是具有一定的學(xué)習(xí)和參考價(jià)值的,值得我們探討一下。
信息流“沼澤”中QQ瀏覽器面對(duì)的選擇
在瀏覽器中,信息流主feed是圖文、短視頻、小視頻混合形態(tài),這也是推薦算法應(yīng)用的主場(chǎng)景。在這些場(chǎng)景中,瀏覽器在不斷發(fā)展的進(jìn)階過(guò)程中容易遇到這些痛點(diǎn)難題:
1.信息繭房現(xiàn)象。內(nèi)容和資訊類(lèi)平臺(tái)不光要推薦熱門(mén)的信息內(nèi)容,也面臨解決一些初始信息的冷啟動(dòng)問(wèn)題,推薦系統(tǒng)如何公正有效的推薦優(yōu)質(zhì)內(nèi)容,使得好內(nèi)容獲得更多的曝光機(jī)會(huì),觸達(dá)更多的人群。
2.面對(duì)具有豐富場(chǎng)景的瀏覽器,其背后的AI研發(fā)需求多樣復(fù)雜,傳統(tǒng)的研發(fā)模式研發(fā)周期長(zhǎng),效率低。比如內(nèi)容視頻化方向,怎么打更好的標(biāo)簽以及做更好的多模態(tài),對(duì)視頻的理解和多模態(tài)的理解如何做到準(zhǔn)確把控等。
3.細(xì)分場(chǎng)景的多樣化與精細(xì)化運(yùn)營(yíng)的需求,信息流目前發(fā)展到了精細(xì)化運(yùn)營(yíng)的階段,需要針對(duì)多種多樣的細(xì)分場(chǎng)景進(jìn)行敏捷優(yōu)化。
無(wú)論是對(duì)于用戶(hù)來(lái)說(shuō),信息內(nèi)容的繭房現(xiàn)象帶來(lái)的一畝三分地的局限“視野”,還是企業(yè)面臨的形態(tài)復(fù)雜、內(nèi)容多樣化進(jìn)階的AI技術(shù)需求等,這些對(duì)信息流內(nèi)容產(chǎn)生影響的挑戰(zhàn)都亟需解決,為內(nèi)容信息的獲取和交互還一片輕快的價(jià)值體驗(yàn)。
QQ瀏覽器在面對(duì)上述挑戰(zhàn)中,選擇運(yùn)用預(yù)訓(xùn)練+finetune+AutoML的新范式和多目標(biāo)多場(chǎng)景聯(lián)合優(yōu)化的新深度模型等創(chuàng)新來(lái)應(yīng)對(duì)信息流這方面的技術(shù)挑戰(zhàn)。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態(tài)技術(shù)與超參數(shù)對(duì)這些瀏覽器難題的優(yōu)化,這兩個(gè)技術(shù)也是此次比賽的兩條賽道。
比如在視頻流的場(chǎng)景中,多模態(tài)的技術(shù)可以根據(jù)視頻觀(guān)看的時(shí)間及關(guān)注的興趣及行為讓下一個(gè)視頻更符合、相似目前觀(guān)看的視頻,在語(yǔ)義上的相似可以讓用戶(hù)的體驗(yàn)更好。QQ 瀏覽器在多模態(tài)技術(shù)中也做了評(píng)價(jià)視頻語(yǔ)義相似度的問(wèn)題,可以更精確地評(píng)價(jià)兩個(gè)視頻的文本區(qū)別,為用戶(hù)不再推薦重復(fù)的內(nèi)容,增強(qiáng)在推薦方面的泛化和興趣探索的能力,很好地緩解信息繭房的問(wèn)題。
而超參數(shù)技術(shù)可以實(shí)現(xiàn)多目標(biāo)融合,也就是在推薦系統(tǒng)中,從刷視頻的點(diǎn)擊率演進(jìn)到點(diǎn)擊、關(guān)注、點(diǎn)贊等同時(shí)完成,超參數(shù)搜索把以前人工尋參的方式通過(guò)網(wǎng)格搜索、非個(gè)性化尋參到個(gè)性化尋參的方式提升效率。在騰訊QQ瀏覽器實(shí)踐過(guò)程中可以減少 80% 以上的尋參時(shí)間,大大提升了推薦系統(tǒng)的研發(fā)效率。
我們知道瀏覽器在實(shí)際的推薦和搜索業(yè)務(wù)場(chǎng)景中,有異常豐富且持續(xù)演化的內(nèi)容需求,這些龐大的內(nèi)容數(shù)據(jù)并沒(méi)有客觀(guān)清晰的定義,數(shù)據(jù)標(biāo)注也就成為內(nèi)容算法研發(fā)的核心瓶頸,而預(yù)訓(xùn)練大模型是解決這一問(wèn)題的“良藥”。
聚焦推薦與搜索:當(dāng)瀏覽器擁抱大模型
預(yù)訓(xùn)練大模型也是近兩年AI產(chǎn)業(yè)中最火的關(guān)鍵詞之一。目前比較有名的模型參數(shù)量都已經(jīng)達(dá)到萬(wàn)億級(jí)別了,應(yīng)用場(chǎng)景差異也比較明顯。以 OpenAI斥巨資打造的GPT-3為例,它依然是偏 NLP 的模型。在A(yíng)I大模型的探索上,無(wú)論是著眼于提升超大規(guī)模AI算力,還是突破學(xué)術(shù)前沿的角度,本質(zhì)上都是通過(guò)將海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練、預(yù)集成,形成高魯棒性、低樣本量需求的大模型。企業(yè)可以根據(jù)自身的應(yīng)用場(chǎng)景,在大模型的基礎(chǔ)上進(jìn)行少量的調(diào)參即可完成落地。
而瀏覽器與大模型的結(jié)合,可以將瀏覽器背后場(chǎng)景的大量?jī)?nèi)容理解、內(nèi)容生成中的AI研發(fā)所需樣本量大大降低,解決標(biāo)注量與成本這個(gè)在瀏覽器整體業(yè)務(wù)場(chǎng)景中的核心瓶頸。
QQ瀏覽器實(shí)驗(yàn)室自研了預(yù)訓(xùn)練模型“神舟”,這個(gè)模型具有百億參數(shù)的訓(xùn)練能力,可以為搜索、推薦、內(nèi)容理解等多種業(yè)務(wù)場(chǎng)景起到直接幫助,提升各種自然語(yǔ)言理解算法效果。神舟預(yù)訓(xùn)練大模型專(zhuān)注中文自然語(yǔ)言理解,基于預(yù)訓(xùn)練的研發(fā)模式,可以提前把語(yǔ)言語(yǔ)義中通用的知識(shí)學(xué)習(xí)到預(yù)訓(xùn)練模型中,針對(duì)下游具體的任務(wù)只需要學(xué)習(xí)任務(wù)相關(guān)的知識(shí)。
通過(guò)該模型QQ 瀏覽器可以微調(diào)和滿(mǎn)足業(yè)務(wù)中出現(xiàn)的如評(píng)論理解、搜索 Query 推薦等NLP 需求,可以減少 40% 以上所需的標(biāo)注數(shù)據(jù)量和相應(yīng)的研發(fā)時(shí)間,節(jié)省了標(biāo)注的成本,大大提升了研發(fā)的效率。在學(xué)術(shù)上,也刷新了業(yè)界紀(jì)錄,登頂了中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn) CLUE 榜單上,成為首個(gè)在中文自然語(yǔ)言理解綜合評(píng)測(cè)數(shù)據(jù)上超過(guò)人類(lèi)水平的預(yù)訓(xùn)練模型。
當(dāng)前神舟大模型已經(jīng)逐步應(yīng)用于 QQ 瀏覽器的搜索、看點(diǎn)資訊、小說(shuō)等多個(gè)場(chǎng)景。隨著大模型進(jìn)一步的迭代和實(shí)踐,也會(huì)深度改造 QQ 瀏覽器的搜索推薦能力,更好地理解并滿(mǎn)足用戶(hù)表達(dá)背后的意圖與需求。
大算力時(shí)代,機(jī)器變得更加理解信息與人,比如在醫(yī)療領(lǐng)域的問(wèn)診問(wèn)答、交互對(duì)話(huà)等實(shí)際場(chǎng)景中,大模型可以為語(yǔ)義的理解帶來(lái)更強(qiáng)的綜合效果,而瀏覽器擁抱大模型,可以更好地沉淀大量的知識(shí),幫助我們更準(zhǔn)確地探索AI與機(jī)器學(xué)習(xí)的邊界。
在全面數(shù)字化遷徙之旅中,我們獲得信息的渠道和服務(wù)方式也變得越來(lái)越便捷智能,對(duì)于瀏覽器行業(yè)來(lái)說(shuō),讓人們以?xún)?yōu)質(zhì)的體驗(yàn)零門(mén)檻獲取價(jià)值信息是核心訴求,基于這個(gè)變化與訴求,QQ 瀏覽器也將自己的技術(shù)品牌升級(jí)為QQ 瀏覽器實(shí)驗(yàn)室以更好地聚焦服務(wù)用戶(hù)。
QQ瀏覽器實(shí)驗(yàn)室:走向下一代信息交互
對(duì)于下一代信息的交互平臺(tái),每個(gè)人心目中的瀏覽器都不一樣,我們可能會(huì)借助元宇宙的技術(shù),通過(guò)手勢(shì)、眼神甚至是意識(shí)來(lái)操控搜索與推薦,當(dāng)我們進(jìn)入沉浸式的新搜索界面時(shí),可能很多的邊界都會(huì)模糊甚至消失,比如消費(fèi)和應(yīng)用的邊界,體驗(yàn)與內(nèi)容的邊界,體驗(yàn)與創(chuàng)作的邊界等,可能搜索就是一個(gè)創(chuàng)作的引子,發(fā)現(xiàn)就是探索開(kāi)始的價(jià)值,用戶(hù)與內(nèi)容與應(yīng)用開(kāi)始層層遞進(jìn)深入,體驗(yàn)和交互的方式全面融合。
無(wú)論是哪種未來(lái)瀏覽器,本質(zhì)上都是搜索網(wǎng)羅信息,精準(zhǔn)推薦價(jià)值內(nèi)容,這也是信息技術(shù)發(fā)展過(guò)程中的不變內(nèi)核。無(wú)論未來(lái)信息交互的前景怎么變化,前提是技術(shù)的不斷更迭、突破才能帶來(lái)體驗(yàn)的重構(gòu)。
(左起:騰訊副總裁郄小虎、信息平臺(tái)與服務(wù)線(xiàn)CTO徐羽、騰訊副總裁殷宇)
QQ瀏覽器瞄準(zhǔn)長(zhǎng)線(xiàn)的數(shù)字化趨勢(shì)價(jià)值,成立“QQ瀏覽器實(shí)驗(yàn)室”技術(shù)品牌,依靠AI、搜索、大數(shù)據(jù)、推薦算法的技術(shù)研究,提升信息與服務(wù)的獲取效率,幫助用戶(hù)零門(mén)檻地獲取價(jià)值信息和服務(wù),革新用戶(hù)與世界的交互方式。
近些年來(lái),我們發(fā)現(xiàn)騰訊越來(lái)越重視AI技術(shù)能力的構(gòu)建,也成立了一些技術(shù)品牌,比如TEG(技術(shù)工程事業(yè)群)和CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),這也是大家心目中離技術(shù)最近的品牌。以?xún)?nèi)容為主的PCG并沒(méi)有得到足夠的關(guān)注。隨著PCG技術(shù)中臺(tái)的成立,推薦AI中臺(tái)也成為騰訊技術(shù)平臺(tái)中的核心中臺(tái),而QQ瀏覽器實(shí)驗(yàn)室是PCG技術(shù)中臺(tái)的核心支撐中臺(tái)模塊之一,不斷為騰訊的推薦業(yè)務(wù)賦能。
實(shí)驗(yàn)室是創(chuàng)新不斷誕生并生根發(fā)芽的地方,搜狗搜索團(tuán)隊(duì)并入后,全網(wǎng)搜索的技術(shù)能力與騰訊垂直搜索的能力形成互補(bǔ),強(qiáng)強(qiáng)聯(lián)手,這個(gè)實(shí)驗(yàn)室就聚合了信息交互中最核心的兩個(gè)技術(shù),可能是我們邁入未來(lái)沉浸式搜索交互的第一步。
我們知道,信息技術(shù)交互平臺(tái)的發(fā)展不斷進(jìn)階的目標(biāo)就是消除鴻溝與隔閡,縮短人與人、人與信息的距離。騰訊信息平臺(tái)與服務(wù)線(xiàn)CTO徐羽也公開(kāi)表示QQ 瀏覽器的進(jìn)階目標(biāo),與之相似都是緊密連接信息與價(jià)值,拓寬用戶(hù)了解世界的眼界。打造互聯(lián)網(wǎng)未來(lái)30年的信息服務(wù)工具,做技術(shù)的擺渡人,讓價(jià)值信息更好地網(wǎng)羅服務(wù)生活,成為探索未知的下一代超級(jí)窗口。
人類(lèi)歷史的長(zhǎng)河中,隨著信息技術(shù)的不斷更迭,會(huì)越來(lái)越注重信息與價(jià)值的準(zhǔn)確與高效,這也就意味著推薦系統(tǒng)是個(gè)無(wú)限增長(zhǎng)且沒(méi)有最優(yōu)解的技術(shù)體系,不斷進(jìn)化是它的特點(diǎn),因此理解用戶(hù)的能力也會(huì)不斷地深入,這樣持續(xù)洞察探索推薦的新趨勢(shì)和方向,會(huì)為用戶(hù)帶來(lái)新一代的交互體驗(yàn)與價(jià)值賦能。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?