京東產(chǎn)業(yè)大模型的幾點(diǎn)猜想
導(dǎo)語:
細(xì)讀今年被稱為“中國人工智能最高獎”的吳文俊獎的獲獎名單,頗有深意。
雖然各大高校、科研機(jī)構(gòu)還是在獲獎名單中占據(jù)多數(shù),但企業(yè)獲獎的數(shù)量也在不斷增長,如我們熟悉的京東、百度、美團(tuán)、阿里、科大訊飛等,悉數(shù)在列。
而他們獲獎的項(xiàng)目,有比較明顯的應(yīng)用導(dǎo)向趨勢,這說明,AI的落地應(yīng)用日益受到關(guān)注。
企業(yè)的優(yōu)勢在于,有大量的場景,積累了精準(zhǔn)的數(shù)據(jù),可以在解決實(shí)際問題中不斷歷練優(yōu)化,再泛化成通用能力賦能社會,這對于進(jìn)入智能化加速普及的今天,有切實(shí)的意義。
備受關(guān)注的大模型,也成為獲獎名單中被關(guān)注的焦點(diǎn),但大模型只是手段,而不是目的。發(fā)展產(chǎn)業(yè)大模型,其價(jià)值仍然是以產(chǎn)業(yè)實(shí)踐中凝聚的數(shù)字化能力服務(wù)社會和提升行業(yè)效率。
可以相信,隨著人工智能奇點(diǎn)的到來和應(yīng)用加速落地,我們的生活將發(fā)生一往而不可逆的變革。
第一部分 企業(yè)獲獎越來越多,折射了什么?
在今年獲得吳獎的企業(yè)中,京東是較為突出的一個(gè)。
京東是唯一同時(shí)獲得個(gè)人和團(tuán)隊(duì)兩項(xiàng)殊榮的企業(yè),其中,只有三席的“杰出貢獻(xiàn)獎”由京東獲得一席,這是除了“最高成就獎”之外,可授予個(gè)人的最高獎項(xiàng),反映了京東在AI領(lǐng)域的人才深度和厚度。
相對老牌AI企業(yè),幾年前京東在AI領(lǐng)域的聲勢并不彰顯。近年,隨著京東的技術(shù)轉(zhuǎn)型的全面展開,數(shù)智供應(yīng)鏈、智能服務(wù)、工業(yè)互聯(lián)網(wǎng)平臺等一系列產(chǎn)業(yè)技術(shù)應(yīng)用逐步為行業(yè)所認(rèn)可。
所以,這次京東摘得個(gè)人獎和團(tuán)隊(duì)獎各一,其實(shí)是反映了有深厚產(chǎn)業(yè)場景基礎(chǔ)和數(shù)字技術(shù)能力的新型實(shí)體企業(yè),在AI領(lǐng)域厚積薄發(fā)的積累優(yōu)勢。
恰好,這次獲獎的京東科技智能服務(wù)與產(chǎn)品部負(fù)責(zé)人何曉冬博士,是我的一位很好相處的朋友,所以我也第一時(shí)間向他求證了一些問題。
說一句閑話,我喜歡曉冬的原因,大概有二:
1.他講的技術(shù)我聽得懂,而且他很耐心,就算我聽不懂,他也會講到我聽懂為止,作為一個(gè)世界級的科學(xué)家,這樣的nice是很難得的;
2.他戴手表;
我喜歡戴傳統(tǒng)手表的科學(xué)家,而非Apple Watch的用戶。尤其當(dāng)我偶爾知道,這只是一塊很普通的精工自動機(jī)械表,簡單可靠,而且是曉冬的父親在一次購物中得到的贈品的時(shí)候,我就覺得他這個(gè)人更有意思了,樸實(shí)、樂觀和堅(jiān)韌是他的性格。
這也讓我想起,《達(dá)芬奇密碼》里魅力十足的虛構(gòu)人物——羅伯特.蘭登教授,就一直戴一塊小時(shí)候得到的米老鼠手表。
這次見到曉冬,其中一個(gè)原因,是他和他的團(tuán)隊(duì)獲得了今年吳獎后,我很想和他聊聊這個(gè)事。但沒有想到,他沒怎么談自己,反而給我科普了一遍京東AI的發(fā)展史。以及這次京東獲獎的任務(wù)型智能對話交互關(guān)鍵技術(shù)及大規(guī)模產(chǎn)業(yè)應(yīng)用這個(gè)課題。
2019年的1月1日,對何曉冬是個(gè)重要的日子,這一天是他正式成為IEEE Fellow的日子。更重要的是2018年他告別海外生涯的一個(gè)告別禮—— 2018年初他正式接受了京東邀請,從微軟雷德蒙研究院的人工智能首席研究員,變成京東的AI業(yè)務(wù)一位重要負(fù)責(zé)人,加入彼時(shí)尚小但正在壯大的京東AI研發(fā)團(tuán)隊(duì)。
彼時(shí),京東已經(jīng)喊出了“技術(shù)、技術(shù)、技術(shù)!”的口號,但外部對于京東在AI方面的能力還沒有充分的認(rèn)知,盡管京東已經(jīng)在各業(yè)務(wù)線開始使用AI技術(shù), 但當(dāng)時(shí)很少人會認(rèn)為京東是一個(gè)AI技術(shù)的高地。
后來我查了一下,亞馬遜有10000多個(gè)AI工程師,微軟是7000人,谷歌是4000多人,但做出ChatGPT的時(shí)候,openAI只有154個(gè)人。
所以,AI是否能做成,和人數(shù)沒有絕對關(guān)系,和方向正確與否關(guān)系更大。
更重要的是,京東改變了我對AI產(chǎn)業(yè)化落地的看法。
以前,大部分AI企業(yè)見到我總要訴的苦是——我們的技術(shù)水平很高,但企業(yè)不理解、用不起來,所以落地難。
曉冬第一次見面就直率的告訴我,這種說法是不對的。
他認(rèn)為:“我們(團(tuán)隊(duì))雖然不大,但經(jīng)過努力已經(jīng)開始盈利了,這對于很多大AI團(tuán)隊(duì)都是難以想象的。但核心其實(shí)只有一個(gè)原因,就是我們力圖搞清楚我們能給市場帶來什么價(jià)值,以及創(chuàng)造這個(gè)價(jià)值的技術(shù)核心點(diǎn)在哪里,然后用我們的技術(shù)和工程能力去搞定。而那些脫離了價(jià)值鎖定的AI研發(fā)看上去是很酷,但很難落地!
相對于其它幾家互聯(lián)網(wǎng)超級平臺的AI研發(fā)規(guī)模,何曉冬的團(tuán)隊(duì)規(guī)模小但更聚焦,而他們的最初的研發(fā)方向也很具體——對內(nèi)依托京東的用戶規(guī)模優(yōu)勢,不斷的優(yōu)化智能客服的服務(wù)能力,對外把這種能力做成產(chǎn)品服務(wù),應(yīng)用在諸如市場推廣外呼、數(shù)字人、智能政務(wù)熱線等多個(gè)商業(yè)化場景里。
而這種市場需求來自于企業(yè)真實(shí)的痛點(diǎn)——即源于解決零售、物流等實(shí)體行業(yè)大規(guī)?蛻舴⻊(wù)人力不足帶來的效率問題。
也就是說,之所以獲得吳獎,除了何曉冬帶隊(duì)的京東云言犀(下稱“言犀”)團(tuán)隊(duì)的出色技術(shù)能力之外,也基于京東AI研發(fā)的務(wù)實(shí)和路徑正確,他們選擇了為現(xiàn)實(shí)中真實(shí)世界復(fù)雜且深度的問題去求解——而這,正是看似默默無聞的京東AI在短短幾年內(nèi),就得到學(xué)界和產(chǎn)業(yè)界如此高度的認(rèn)可的原因。
第二部分 解決真實(shí)世界的難題
根據(jù)人工智能算法、算力和數(shù)據(jù)三要素,企業(yè)優(yōu)先發(fā)展的,要么是結(jié)構(gòu)性數(shù)據(jù)比較多的應(yīng)用落點(diǎn),要么是市場上解決方案較少的新領(lǐng)域。
如果這樣排列,那客服場景應(yīng)該不在首列,因?yàn)槟壳癗LP(自然語言處理)是AI最成熟的領(lǐng)域之一,各大企業(yè)基本都有各式各樣的智能客服業(yè)務(wù)。
在一個(gè)群雄盤踞、成熟產(chǎn)品迭出的領(lǐng)域搞創(chuàng)新,是需要格外的勇氣的。
但是,京東還是選擇了智能服務(wù)場景,理由也很簡單——業(yè)務(wù)需要、場景支持。
但做,就要做出新意。
如果仔細(xì)推敲這次京東獲獎項(xiàng)目的名稱,會發(fā)現(xiàn)有一個(gè)比較特別的詞匯——任務(wù)型對話。
打個(gè)比方,這次震驚消費(fèi)者的Chat GPT,就不是典型的任務(wù)型對話,因?yàn)槭褂谜邔τ趯υ捊Y(jié)果的寬容度很高,甚至可以視為一種娛樂,可以接受各種”胡說八道“;但客服對話,則不同于一般對話場景,所謂的任務(wù)型對話,就是需要解決真實(shí)世界深度復(fù)雜的任務(wù),而且達(dá)到很高的滿意度。
從優(yōu)勢角度來看,京東服務(wù)超5.8億用戶,每年十幾億人次的對話交互服務(wù),既是智能對話交互技術(shù)產(chǎn)業(yè)落地的前沿陣地,又天生有大量的數(shù)據(jù)可以作為訓(xùn)練內(nèi)容。
從挑戰(zhàn)來看,自然語言處理是目前AI最成熟的領(lǐng)域之一,要想在強(qiáng)敵環(huán)伺之下殺出重圍并不是一件簡單的問題。
但言犀團(tuán)隊(duì)的思路很清晰,把這個(gè)復(fù)雜系統(tǒng)拆解成了幾個(gè)核心命題。
其中,首要解決的是高表現(xiàn)力和高可信度的多模態(tài)對話生成。
簡單來說,就是在智能客服與人類客戶對話的過程中,要實(shí)時(shí)判斷對用戶的情緒是高興、憤怒、失望等等,再相應(yīng)的用適合的、富有表現(xiàn)力而非干巴巴的文字或電子合成音去回答這個(gè)問題。
但是單純從文字和語音是難以完全的分辨客戶情緒的,所以還要結(jié)合客戶的上下文來推測。但這就需要新的算法,因?yàn)閭鹘y(tǒng)算法生成內(nèi)容時(shí),對上下文的建模(也就是模型和訓(xùn)練)關(guān)聯(lián)度不足,導(dǎo)致生成的內(nèi)容缺乏表現(xiàn)力,也不準(zhǔn)確。
要從技術(shù)維度解釋這個(gè)問題,需要花費(fèi)大量的篇幅,所以我只說幾點(diǎn)。
首先,針對生成高表現(xiàn)力語音這個(gè)問題,言犀團(tuán)隊(duì)提出了“基于多顆粒度韻律的增強(qiáng)語音合成技術(shù)”,也就是從篇章、句子、字詞的不同粒度,準(zhǔn)確把握用戶的情緒,對應(yīng)的提高合成語音的韻律豐富度和可控性。
而僅僅針對這個(gè)問題,言犀團(tuán)隊(duì)提出的語音合成技術(shù),就獲得了ACM Multimedia 2021最佳演示獎。
而對生成高質(zhì)量對話內(nèi)容至關(guān)重要的,還有對于用戶意圖的理解或預(yù)測,簡單說就是“聽懂人話,猜出意思”。
這里的核心理論支撐,某種程度上來自何曉冬此前的一篇在行業(yè)里非常有影響力的論文 ”Hierarchical Attention Networks for Document Classification”,這是一篇谷歌學(xué)術(shù)引用次數(shù)近5000次的論文,即使在世界AI領(lǐng)域也是頂尖的。
但何曉冬謙虛的認(rèn)為,自己的論文只是解決了部分理論的問題,而團(tuán)隊(duì)的勤奮和工程化落地,才是成功的關(guān)鍵。
值得一提的是,這里還有一個(gè)隱藏的彩蛋就是,針對對話內(nèi)容的生成,團(tuán)隊(duì)還使用了基于知識融合的預(yù)訓(xùn)練語言模型和多模態(tài)可控對話文本生成模型,從而提升生成文本的專業(yè)度、豐富度。
你可以理解為,這兩個(gè)模型可以看做是今天大名鼎鼎的ChatGPT的兩個(gè)子集,但很早就被京東用起來了,而這將對京東以后構(gòu)建產(chǎn)業(yè)大模型有很關(guān)鍵的驗(yàn)證作用。
而從這個(gè)問題的解決中淬煉出來的方案,形成了京東智能服務(wù)解決方案中的多輪對話決策推理技術(shù),并達(dá)到國際領(lǐng)先水平,先后斬獲國際競賽Wikihop、HotpotQA的冠軍。
但支撐這一體系的并非僅這一項(xiàng)領(lǐng)先技術(shù)。
如果你使用過語音客服,你就會發(fā)現(xiàn),如果你的表達(dá)過于口語化、或者有不規(guī)律停頓等問題的情況下,會對客服的效果有很大的影響,有時(shí)候會使得對話嚴(yán)重偏離場景,這背后是一個(gè)人/機(jī)話語權(quán)的決策問題。
很顯然,我們不可能在使用語音客服時(shí),要求每個(gè)人都有播音員一樣連貫、準(zhǔn)確的發(fā)音。
而對于這個(gè)問題,言犀團(tuán)隊(duì)提出了多模態(tài)融合的話語權(quán)決策技術(shù) (Turn taking),根據(jù)實(shí)際情況,在瞬息間判斷對話是否會中斷以及在什么時(shí)候AI需要耐心等待用戶說完話,又在什么時(shí)候需要AI需要及時(shí)接過話語權(quán)。
可以說,言犀團(tuán)隊(duì)正是用”剝洋蔥“式的方法,把實(shí)際問題拆解成一個(gè)個(gè)更小的單元,然后在核心算法的突破下創(chuàng)造性的解決工程問題,最終的結(jié)果不僅是獲得吳文俊獎這樣的頂級榮譽(yù),還產(chǎn)生了巨大的產(chǎn)業(yè)溢出效應(yīng)——在這個(gè)項(xiàng)目完成的過程中,還完成了授權(quán)發(fā)明專利17件,軟件著作權(quán)19項(xiàng),論文63篇,國際比賽冠軍6項(xiàng);更讓團(tuán)隊(duì)驕傲的是,產(chǎn)生直接經(jīng)濟(jì)價(jià)值20億元。
第三部分 用戶云集
現(xiàn)在,智能客服市場競爭激烈之極,但高水平產(chǎn)品并不多。
言犀再次基于“從實(shí)體中來,到實(shí)體中去”的原則,它把智能客服和京東的其它AI能力組合起來,這些能力都聚焦于以服銷一體化為方向,為客戶提供用戶服務(wù)、觸達(dá)、增長等能力,故此被稱為”京東云言犀超級SaaS增長引擎“。
定位在SaaS層,是為了便于部署和符合大多數(shù)非數(shù)字化原生企業(yè)的實(shí)際落地環(huán)境,因?yàn)椴皇敲總(gè)企業(yè)都有自建的PaaS層能力。
伊利集團(tuán)是最早引入言犀的智能咨詢導(dǎo)購、智能外呼、虛擬主播等服銷一體化服務(wù)的巨頭型企業(yè)之一,合作亮點(diǎn)頗多。
例如,伊利曾經(jīng)測算過,旗下多個(gè)奶粉類店鋪,接入言犀提供的智能服務(wù)后,單店僅一個(gè)月便實(shí)現(xiàn)人力節(jié)約71.06人天,于是,其旗下多個(gè)品牌線,如安慕希、巧樂茲、金典等,都持續(xù)采用言犀智能外呼覆蓋私域加粉、活動營銷、意向初篩等眾多場景。
而前述的增加語音高表現(xiàn)力的技術(shù),成為言犀首創(chuàng)的“明星真人語音”外呼應(yīng)用的技術(shù)支撐,在行業(yè)里引發(fā)了一場新的交互式營銷潮流,各大企業(yè)紛紛嘗試。去年他們還推出了多模態(tài)數(shù)字人,基于智能對話交互能力,發(fā)展出多模態(tài)數(shù)字人交互技術(shù),以SaaS直播以及KA數(shù)字員工等模式對外應(yīng)用。在今年京東618的直播間,有很多就是言犀提供的產(chǎn)品。
在政府服務(wù)方向,山西省大同市在言犀的技術(shù)支持下,于2021年2月引入京東智能政務(wù)熱線,在降本增效的同時(shí),還大幅提升了群眾的滿意度和服務(wù)體驗(yàn)。同時(shí),京東智能政務(wù)熱線還可以針對這對熱點(diǎn)問題進(jìn)行分析、研判,讓城市管理者做到未訴先辦,防患于未然。
而在金融方向上,以江南農(nóng)商銀行為例,言犀與其合作打造的“江南農(nóng)商銀行VTM數(shù)字員工”,是全國第一個(gè)能獨(dú)立、全程辦理銀行真實(shí)交易的數(shù)字人,被客戶稱為“01號數(shù)字員工”。
也許讀者讀到這里會問,這和目前火熱的生成式大模型,有什么關(guān)聯(lián)呢?
第四部分 產(chǎn)業(yè)大模型正在路上
在回答這個(gè)問題前,我們要談一個(gè)價(jià)值觀的問題。
京東一直有目標(biāo),那就是作為“以供應(yīng)鏈為基礎(chǔ)的技術(shù)與服務(wù)企業(yè)”,京東將用數(shù)智化技術(shù)連接和優(yōu)化社會生產(chǎn)、流通、服務(wù)的各個(gè)環(huán)節(jié),降低社會成本、提高社會效率。
這是一切的前提,所以京東一定、也必須會做產(chǎn)業(yè)大模型。
但我們注意到,和很多企業(yè)、甚至是創(chuàng)業(yè)團(tuán)隊(duì),一上來就表示要做千億、萬億參數(shù)的通用大模型相比,資源更為豐富的京東提出的卻是“產(chǎn)業(yè)大模型”。
也就是說,京東瞄準(zhǔn)的不但是大模型具有的廣譜的“智能涌現(xiàn)”能力,同時(shí)還將其與行業(yè)的know-how相結(jié)合,針對行業(yè)把能力做深,從而為行業(yè)創(chuàng)造深度的價(jià)值。這和其它企業(yè)的路徑明顯不同,京東對大模型的投入是做好了充分準(zhǔn)備的。
我認(rèn)為,這反而是京東更可能成功并率先的用大模型服務(wù)于產(chǎn)業(yè)的一個(gè)重要判斷。
京東擁有零售、物流、健康、工業(yè)品等廣泛實(shí)體業(yè)務(wù),具有龐大而又復(fù)雜的產(chǎn)業(yè)生態(tài),服務(wù)數(shù)十萬商家和超5.8億消費(fèi)者,它的AI,是生長在供應(yīng)鏈上的產(chǎn)業(yè)AI,它的目標(biāo),就是解決實(shí)際問題再泛化成通用能力賦能社會。
所以筆者猜測,京東的做法,就是聚焦AI的產(chǎn)業(yè)價(jià)值,先解決實(shí)際問題,接受正向或負(fù)向的反饋。
為什么要這么做呢,因?yàn)橐煤卯a(chǎn)業(yè)大模型,都離不開三個(gè)具體的場景:
1.有足夠清晰的應(yīng)用落點(diǎn);
2.有足夠規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)集;
3.有足夠的垂直領(lǐng)域的人才;
也就是說,和通用AI的“算法、算力、數(shù)據(jù)”三要素略有不同,產(chǎn)業(yè)級落地講的是“數(shù)據(jù)、人才和場景”。
優(yōu)質(zhì)的大模型,需要的不僅僅是數(shù)據(jù),而是精煉的、高質(zhì)量的、蘊(yùn)含行業(yè)know-how的優(yōu)質(zhì)產(chǎn)業(yè)數(shù)據(jù)。
對于京東來說,場景和人才都不缺乏,在產(chǎn)業(yè)級數(shù)據(jù)層面更有顯著優(yōu)勢。
作為一個(gè)高度數(shù)據(jù)化、超大規(guī)模的新型實(shí)體企業(yè),京東的數(shù)字化程度很高,并且其在供應(yīng)鏈的全環(huán)節(jié),例如倉儲、配送、營銷、服務(wù)等,都積累了高質(zhì)量的數(shù)據(jù)。
所以,筆者認(rèn)為,京東的選擇是最務(wù)實(shí)的,也是最適配自身優(yōu)勢的。它的做法,會是類似于言犀團(tuán)隊(duì)攻克客服場景一樣的做法 ——?通過通用數(shù)據(jù)給大模型帶來了基本常識,推理、涌現(xiàn)、表達(dá)能力,加上京東自身的專業(yè)性數(shù)據(jù)的引入,在京東內(nèi)外部真實(shí)場景中應(yīng)用起來,并解決工程上的重要難點(diǎn),形成數(shù)據(jù)與應(yīng)用的飛輪,不斷優(yōu)化大模型的性能。并極度降低行業(yè)使用門檻,應(yīng)用時(shí)只需少量的場景數(shù)據(jù)微調(diào),就可以達(dá)成很好的結(jié)果,這也是京東這類擁有場景企業(yè)的優(yōu)勢。
而后,不斷的重復(fù)這個(gè)過程,把諸多產(chǎn)業(yè)問題逐一解決。在這個(gè)過程中,有一些數(shù)據(jù)可以復(fù)用,有大量的方法可以復(fù)用,這就形成了一個(gè)自增強(qiáng)的有效閉環(huán),最終形成具有京東特色、能夠解決供應(yīng)鏈各領(lǐng)域問題、覆蓋多個(gè)行業(yè)場景的大模型。
這便是京東從已有通用大模型通往產(chǎn)業(yè)大模型的路徑。而且一出手,就自帶針對各行業(yè)、領(lǐng)域的解決方案,能夠迅速落地。
簡單說就是,從上往下做,好看、好聽,但容易找不到抓手、腳步虛;從下往上做,顯得沒那么酷,但每一步都是走上坡路,步步踏實(shí),最后才能攀登到一個(gè)很高的高度。
京東的產(chǎn)業(yè)大模型,就在不遠(yuǎn)的前方,讓我們共同期待。
原文標(biāo)題 : 京東產(chǎn)業(yè)大模型的幾點(diǎn)猜想

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?