訂閱
糾錯
加入自媒體

騰訊靠什么突圍“百模大戰(zhàn)”?

2023-07-12 10:28
BT財經(jīng)
關注

作 者 | 張津京

了解更多金融信息 | BT財經(jīng)數(shù)據(jù)通正文共計4371字,預計閱讀時長11分鐘

大模型的“百模大戰(zhàn)”,騰訊終于下場。 

從6月19日發(fā)布自己的行業(yè)大模型,到7月16日召開的世界人工智能大會,騰訊云行業(yè)大模型率先登場,越來越清晰的事實背后,凸顯著騰訊對于大模型領域的思考。 

尤其是跟BAT其他兩家的選擇不同,騰訊上來首先端出的是行業(yè)大模型,而不是通用大模型。這意味著騰訊其實找到了在這個領域放大自身優(yōu)勢的方式。 

因為是國內互聯(lián)網(wǎng)企業(yè)最早點出要推動數(shù)字融合,推進產(chǎn)業(yè)互聯(lián)網(wǎng)發(fā)展的平臺,騰訊從一開始接觸到大模型,想到的就是如何與產(chǎn)業(yè)相結合。 

關鍵,讓人意想不到的是,秉持這個邏輯下場,騰訊其實直奔解決大模型研發(fā)方一直糾結的一個問題:那就是大模型該如何保證長期可持續(xù)發(fā)展。 

只有做到這一點,任何大模型才能談得上有未來。 

1

大模型是用來解決問題的

騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生,在世界互聯(lián)網(wǎng)大會產(chǎn)業(yè)發(fā)展論壇做主題演講時表示,通用大模型有很強的能力,但并不能解決很多企業(yè)的具體問題。“企業(yè)的大模型應用需要綜合考慮行業(yè)專業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素。基于行業(yè)大模型,構建自己的專屬模型,也許是企業(yè)更優(yōu)的選項”。 

這恰恰說出了當下大模型產(chǎn)業(yè)發(fā)展的一個現(xiàn)實。 

從Open AI發(fā)布ChatGPT3.5開始,浮躁成為這個行業(yè)的外顯標簽之一。越來越多的企業(yè)開始在這個領域炫技。 

高峰時期,美國硅谷每天會產(chǎn)生幾十個大模型相關的論文,上百個與大模型相關的創(chuàng)業(yè)產(chǎn)品DEMO視頻。“每個視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對于技術該怎么用一般都沒有答案。”大模型知名研究者,計算機工程碩士李莉認為,現(xiàn)在很多模型的研究者和應用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化。“如果真正放到經(jīng)濟中,你會發(fā)現(xiàn)根本用不上。” 

在她看來,這已成為行業(yè)通病。 

同樣國內大模型的紛至沓來,相關的事情也沒少做。例如讓大模型直接作詩或者用方言將相關的內容讀出來,甚至做成視頻之類,頻繁出現(xiàn)在模型研發(fā)方發(fā)布會的現(xiàn)場。 

這其實是一種市場推廣行為,但并不意味著大模型真正要在這個方面實現(xiàn)應用。 

最近Newsweek有一個商業(yè)調查顯示,ChatGPT的用戶數(shù)量已經(jīng)比一二月份高峰時期下降了近95%。在統(tǒng)計原因中,“感覺ChatGPT對工作的促進能力沒有想象那么強”,是用戶選擇最多的一個結果。 

“從技術看這個是一個特別正常的結果”,李莉表示類似ChatGPT這樣的通用大模式,其訓練數(shù)據(jù)來自互聯(lián)網(wǎng)所有能找到的相關數(shù)據(jù),無論對錯全部輸給模型學習,只在輸出的時候由人工來核實部分結果并標注結果輸出的邊界。“因此,通用大模型往往變成那種看起來像專家的答案,但真正被行業(yè)內人士分析就發(fā)現(xiàn)似是而非。” 

在她看來,未來大模型發(fā)展最快的肯定不是ChatGpt這類通用模型,“產(chǎn)業(yè)模型或者細分行業(yè)模型有很大機會,因為只有在專業(yè)領域由專業(yè)的人員輔助大模型學習專業(yè)知識,才能真正為行業(yè)提供需要的人工智能輔助”。 

對此,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生也表示,通用大模型一般是基于廣泛的公開文獻與網(wǎng)絡信息來訓練的,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導致回答的行業(yè)針對性與精準度不夠。“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個場景的需求。”但用戶對企業(yè)提供的專業(yè)服務,要求高、容錯性低,企業(yè)一旦向公眾提供了錯誤信息,可能引起嚴重后果。 

2

TO B才是大模型未來發(fā)展核心

其實ChatGPT也不是沒想過要進入行業(yè)應用市場,但在理想與現(xiàn)實之間有了一個巨大的鴻溝。 

眾所周知,通用大模型是利用互聯(lián)網(wǎng)知識進行培訓的,即所謂通用數(shù)據(jù)。其中既要花費大量的數(shù)據(jù)和資金進行訓練,可能效果還不是很好;另一方面又要維持日常運營,相關投入也非常大,讓一般的通用大模型壓力很大。 

OpenAI的創(chuàng)始人在接受硅谷媒體的訪談時,也曾就ChatGPT3.5的邏輯和思維展現(xiàn)能力進行過闡述,然而他并不清楚ChatGPT3.5是如何實現(xiàn)這一功能的。事實上,他們在訓練ChatGPT的過程中,一直在不斷地將微軟必應搜索中的結果和用戶的對話數(shù)據(jù)輸入其中。 

在訪談的最后,他也承認ChatGPT的出現(xiàn)只是一個美麗的誤會,但他們所能做的就是不斷為這樣的大模型提供資源,無論是軟件還是硬件都在此列。據(jù)觀看了這場訪談的李莉了解,OpenAI在短短三年內就已經(jīng)燒掉了180億美元,現(xiàn)在又緊急融資了100億美元。這一事實恰恰印證了這一點。

但由于他們在行業(yè)上數(shù)據(jù)搜集能力不強,造成通用模型對于行業(yè)應用適用程度較低,沒有想象的好用。 

另一方面,自2018年騰訊啟動930變革以來,中美互聯(lián)網(wǎng)技術的發(fā)展出現(xiàn)了明顯的路線差異。 

各家互聯(lián)網(wǎng)企業(yè)以數(shù)實融合為開發(fā)產(chǎn)品和技術的基本思路,這體現(xiàn)了中國互聯(lián)網(wǎng)企業(yè)在滿足制造業(yè)和實際生產(chǎn)需求方面更為緊密的聯(lián)系。 

從這一角度來看,中國互聯(lián)網(wǎng)企業(yè)將在推動社會經(jīng)濟發(fā)展方面具有更清晰明確的角色。 

有趣的是,大模型的成長和訓練需要大量數(shù)據(jù)的支持。ChatGPT和谷歌Bard等領先的模型都是在通用大模型領域進行訓練的,它們的背后都有搜索引擎帶來的龐大數(shù)據(jù)支持。然而,盡管這些數(shù)據(jù)量龐大,但在特定行業(yè)的數(shù)據(jù)量和數(shù)據(jù)活躍度上,尚未完全滿足用戶的需求。 

這實際上為中國企業(yè)提供了彎道超車的機會。中國龐大的人口基數(shù)使其在各個行業(yè)擁有比美國甚至世界其他國家更豐富的數(shù)據(jù)積累。無論是醫(yī)療、法律、物流還是細分行業(yè)的生產(chǎn)。在國家數(shù)據(jù)安全法的指導下,這些數(shù)據(jù)天然地與海外大模型隔離,保證了數(shù)據(jù)安全。 

因此,這些B端數(shù)據(jù)被認為是中國大模型企業(yè)的巨大優(yōu)勢。 

比如,中國已榮升為全球最大的工業(yè)機器人生產(chǎn)國和消費國,全球機器人市場中的75%是由中國的企業(yè)所購買。這些購買機器人的企業(yè),通常都將其機器人應用于核心工藝和核心流程中。 

這一現(xiàn)象意味著,如果這些企業(yè)希望通過引入人工智能模型以提高管理效率,它們就必須部署自己的私有人工智能模型。他們需要通過訓練自己生產(chǎn)中的數(shù)據(jù),以滿足企業(yè)的發(fā)展需求。 

如果能從中國一線企業(yè)采集到絕大多數(shù)機器人使用的參數(shù)和對應的數(shù)據(jù),就能以最快的速度幫助這些企業(yè)建立和訓練屬于自己的人工智能模型。 

在這一點上,中國企業(yè)具有天然的優(yōu)勢。 

3

為什么是騰訊先落子

專屬行業(yè)大模型,目前國內騰訊是首先落子的領軍者之一。

在所有人都開始關注行業(yè)大模型的時候,在百度、阿里、科大訊飛等國內大模型開發(fā)方都開始轉型行業(yè)大模型的時候,為什么騰訊能最先發(fā)布自己的行業(yè)大模型呢? 

這可能跟騰訊在國內率先提出互聯(lián)網(wǎng)平臺要跟產(chǎn)業(yè)相結合有關。 

一方面,這幾年騰訊利用互聯(lián)網(wǎng)技術和AI技術,在實體經(jīng)濟和生產(chǎn)一線做了很多嘗試,推動了很多新模式的落地,這已經(jīng)成為中國數(shù)實融合的樣板。騰訊在其中積累了很多面對行業(yè)企業(yè)的服務經(jīng)驗和數(shù)據(jù),同時也對行業(yè)企業(yè)的需求非常清楚,這為其建立行業(yè)大模型提供了良好的基礎。 

另一方面,騰訊專門為行業(yè)大模型打造了自己的技術平臺。 

這里面首先是星脈網(wǎng)絡,這是騰訊云正式發(fā)布新一代HCC高性能計算集群。該集群采用騰訊云星星海自研服務器,服務器之間采用業(yè)界最高的3.2T超高互聯(lián)帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。 

其次是騰訊云專門為行業(yè)大模型打造的AI 原生(AI Native)向量數(shù)據(jù)庫。該數(shù)據(jù)庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。 

正是有了這樣的技術基礎,加上騰訊這些年服務行業(yè)客戶的經(jīng)驗和獲得的數(shù)據(jù),讓騰訊有了率先推出行業(yè)大模型的底氣。 

騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲在人工智能大會期間接受媒體專訪時表示,騰訊希望在每個特定場景里面100%解決客戶的問題,“而不是找100個產(chǎn)品解決70%到80%的問題”。 

在他看來,騰訊會聚焦找一些特定的行業(yè)跟客戶深入打磨解決行業(yè)的問題,“比如說文旅行業(yè)跟客戶做一些深入探討,比如說OTA領域的客戶在業(yè)務流程里面用大模型的技術,結合自身的業(yè)務場景,還有數(shù)據(jù)相關的東西對大模型進行精調,解決他的問題”。 

關鍵,騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā),基于大模型高性能計算集群,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和“量體裁衣、普惠適用”的行業(yè)模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。 

騰訊云TI平臺行業(yè)精調解決方案,支持客戶用自己的數(shù)據(jù)一站式訓練精調,構建自己的專屬大模型。具備五大優(yōu)勢:提供高質量的行業(yè)大模型、完善的平臺工具、成熟的流程服務、全面的配套服務、領先的安全能力保障。 

比如騰訊云升級行業(yè)大模型應用場景,行業(yè)大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊云風控大模型融合了騰訊過去20多年黑灰產(chǎn)對抗經(jīng)驗,和上千個真實業(yè)務場景,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。企業(yè)可以基于prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現(xiàn)全流程零人工參與,建模時間也從2周減少到僅需2天。 

再比如過去的同傳技術,往往需要大量樣本數(shù)據(jù)進行訓練,尤其涉及一些特別專業(yè)領域的翻譯,也需要人工加持進行調優(yōu),才能保障翻譯效果;谛袠I(yè)大模型技術,不再需要百萬級的訓練數(shù)據(jù),使用小樣本訓練便也可以獲得不錯的翻譯結果,讓每一次交互翻譯,都對下句的翻譯提升發(fā)揮實時作用…… 

換句話說,騰訊既準備好自己的技術基礎,又有行業(yè)數(shù)據(jù)知道行業(yè)想要什么,還做了一整套幫助企業(yè)落地大模型在自身業(yè)務應用的產(chǎn)品,形成了一整套推動大模型行業(yè)化的能力。 

當然,騰訊對行業(yè)大模型是持開放態(tài)度的,他們覺得大模型是需要多分共同努力的結果。吳運聲就表示,大模型時代開放是非常重要的一個特點,“底層的技術變化太快,技術的這些外延的能力會非常廣,這種情況下發(fā)揮最大的價值只有開放,通過開放提升讓更多人加入進來,更多行業(yè)的專家,各類的角色人員加入進來,我們才能讓這個生態(tài),整個體系更加的健康,產(chǎn)生更多的可能性”。 

對此,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生也認為,伴隨著大語言模型的發(fā)展,產(chǎn)業(yè)和社會也將從數(shù)字化、網(wǎng)絡化,走向智能化。“在這個過程中,騰訊始終認為,人工智能發(fā)展的根本目標是落地于產(chǎn)業(yè),服務于人”。 

因為,只有能真正解決用戶需求、距離場景和數(shù)據(jù)更近的企業(yè),才能擁有大模型的未來。

文章系作者個人觀點如有疑問及任何意見反饋可直接在評論區(qū)留言或發(fā)送郵件

       原文標題 : 騰訊靠什么突圍“百模大戰(zhàn)”?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號