第三代AI的“大”機遇
近年來,人工智能(AI)依靠深度學(xué)習(xí)、計算機視覺、自然語言處理等技術(shù)突破與落地應(yīng)用,不斷顛覆著人類的既有認知——AlphaGo 通過自我強化學(xué)習(xí)擊敗了人類的頂尖圍棋選手;而近日 Alphafold 更是破解了一項過去 50 年生物學(xué)領(lǐng)域的重大挑戰(zhàn)——蛋白質(zhì)分子折疊問題。
自 1956 年 AI 的概念首次被提出后,AI 至今已有 60 多年的發(fā)展史。如今,隨著相關(guān)理論和技術(shù)的不斷革新,AI 在數(shù)據(jù)、算力和算法“三要素”的支撐下越來越多地走進我們的日常生活,比如我們常見的語音識別、人臉識別和機器翻譯等,都已經(jīng)在手機、電腦等智能設(shè)備上有所應(yīng)用。
但是,這一系列驚喜的背后,卻是大多數(shù) AI 在語言理解、視覺場景理解、決策分析等方面的舉步維艱:這些技術(shù)依然主要集中在感知層面,即用 AI 模擬人類的聽覺、視覺等感知能力,卻無法解決推理、規(guī)劃、聯(lián)想、創(chuàng)作等復(fù)雜的認知智能化任務(wù)。當(dāng)前的 AI 缺少信息進入“大腦”后的加工、理解和思考等,做的只是相對簡單的比對和識別,僅僅停留在“感知”階段,而非“認知”,以感知智能技術(shù)為主的 AI 還與人類智能相差甚遠。
究其原因在于,AI 正面臨著制約其向前發(fā)展的瓶頸問題:大規(guī)模常識知識庫與基于認知的邏輯推理。而基于知識圖譜、認知推理、邏輯表達的認知圖譜,則被越來越多的國內(nèi)外學(xué)者和產(chǎn)業(yè)領(lǐng)袖認為是“目前可以突破這一技術(shù)瓶頸的可行解決方案之一”。
目前,人工智能的發(fā)展經(jīng)歷了從表示、計算到感知兩個階段,下一個階段的核心是認知。早在 2016 年,中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸就提出了第三代 AI 體系的雛形,并于 2018 年底正式公開第三代 AI 的理論框架體系,其核心思想為:建立可解釋、魯棒性的 AI 理論和方法;發(fā)展安全、可靠、可信及可擴展的 AI 技術(shù);推動 AI 創(chuàng)新應(yīng)用。
2019 年,圖靈獎得主約書亞·本吉奧(Yoshua Bengio)在 NeurIPS 大會上也指出,深度學(xué)習(xí)應(yīng)該以感知為主向,向基于認知的邏輯推理和知識表達的方向發(fā)展,這個思想和張鈸院士提出的第三代 AI 的思路不謀而合。
圖 | AI 的發(fā)展階段
如今,第三代 AI 的理念在國內(nèi)外獲得廣泛影響力。業(yè)內(nèi)普遍認為,認知智能將是進一步釋放人工智能產(chǎn)能的關(guān)鍵。而認知圖譜是實現(xiàn)認知智能技術(shù)突破的關(guān)鍵,不僅可以讓機器理解數(shù)據(jù)本質(zhì),還可以讓機器解釋現(xiàn)象本質(zhì)。
認知圖譜:實現(xiàn)認知智能的關(guān)鍵
機器認知智能的發(fā)展過程本質(zhì)上是人類腦力不斷解放的過程,是人工智能的最高階段。但是,讓機器具備認知智能,其核心就是讓機器具備理解和解釋能力。這種能力的實現(xiàn)與大規(guī)模、結(jié)構(gòu)化的背景知識是密不可分的。
盡管目前的智能系統(tǒng)在感知方面已經(jīng)達到甚至超越人類水平,但在魯棒性、可解釋性、安全可靠等方面還存在很多不足。比如,模型魯棒性差,難以與準確性共生;模型可解釋性差,對于可靠性要求高的任務(wù)很難勝任;缺乏積累知識的能力,也沒能和人類已有的知識體系進行很好的關(guān)聯(lián),缺乏可靠的推理方法。
認知圖譜旨在結(jié)合認知心理學(xué)、腦科學(xué)和人類知識等,研發(fā)融合知識圖譜、認知推理、邏輯表達的新一代認知引擎,支持大規(guī)模知識的表示、獲取、推理與計算的基礎(chǔ)理論和方法,實現(xiàn)人工智能從感知智能向認知智能的演進,建立可解釋、魯棒性的認知智能。
作為一種實現(xiàn)機器認知智能的底層支撐手段,認知圖譜在電商平臺、智慧城市、司法行業(yè)、金融行業(yè)、安防行業(yè)、大數(shù)據(jù)的精準與精細分析、智慧搜索、智能推薦、智能解釋、自然人機交互等方面具有極為重要的作用。
認知圖譜的歷程發(fā)展可以追溯到語義網(wǎng)絡(luò)(Semantic Network)。1968 年,M. Ross Quillian 在研究人類長期記憶模型時,描述了人類長期記憶的一般結(jié)構(gòu)模型,認為記憶由概念之間的聯(lián)系來實現(xiàn),并存儲在復(fù)雜的網(wǎng)絡(luò)中,并基于此提出了語義網(wǎng)絡(luò)的概念。
同年,專家系統(tǒng)之父、圖靈獎得主愛德華·費根鮑姆(Edward Feigenbaum)等人研發(fā)出了世界首個專家系統(tǒng) DENDRAL。專家系統(tǒng)是早期 AI 的一個重要分支,它可以看作是一類具有專門知識和經(jīng)驗的計算機智能程序系統(tǒng),一般采用 AI 中的知識表示和知識推理技術(shù)來模擬通常由領(lǐng)域?qū)<也拍芙鉀Q的復(fù)雜問題。
1998 年,萬維網(wǎng)之父、ACM 圖靈獎獲得者蒂姆·伯納斯-李(Tim Berners-Lee)爵士也提出了語義網(wǎng)的概念,其核心理念是通過給萬維網(wǎng)上的文檔(如:HTML 文檔、XML 文檔)添加能被計算機理解的語義“元數(shù)據(jù)”(Meta Data),使整個互聯(lián)網(wǎng)成為一個通用的信息交換媒介,即用知識表示互聯(lián)網(wǎng),建立常識知識庫。
2006 年,蒂姆·伯納斯-李提出鏈接數(shù)據(jù)(Linked Data)的概念,表示數(shù)據(jù)不僅僅發(fā)布于語義網(wǎng)中,還要建立起數(shù)據(jù)之間的鏈接,從而形成一張巨大的鏈接數(shù)據(jù)網(wǎng),其目的是構(gòu)建一張計算機能理解的語義數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò),從而在此之上構(gòu)建更智能的應(yīng)用。
2012 年,Google 的阿米特·辛格爾(Amit Singhal)等人介紹了知識圖譜(Knowledge Graph)的概念。知識圖譜以語義網(wǎng)絡(luò)的結(jié)構(gòu)化方式描述客觀世界中概念、實體、事件以及它們之間的關(guān)系,相對于傳統(tǒng)的本體和語義網(wǎng)絡(luò)而言,實體覆蓋率更高,語義關(guān)系也更加復(fù)雜而全面。
圖 | 認知圖譜的演化歷程(來源:報告《人工智能之認知圖譜》)
但是,要讓機器具備認知智能,其核心就是讓機器具備理解和解釋能力,這種能力的實現(xiàn)與大規(guī)模、結(jié)構(gòu)化的背景知識是密不可分的。2020 年,清華大學(xué)計算機系教授、系副主任唐杰在“人工智能下一個十年”報告中,結(jié)合認知科學(xué)和計算機理論,提出了一個實現(xiàn)認知智能的可行思路,即“認知圖譜 = 知識圖譜 + 認知推理 + 邏輯表達”,并希望利用知識表示、推理和決策,以及人的認知來解決復(fù)雜問題。
這個思路的基本思想是結(jié)合認知科學(xué)中的雙通道理論:人腦的認知系統(tǒng)中存在兩個系統(tǒng),即 System 1 和 System 2。System 1 是一個直覺系統(tǒng),它可以通過人對相關(guān)信息的直覺匹配尋找答案,非常快速、簡單;而 System 2 是一個分析系統(tǒng),它通過一定的推理、邏輯找到答案。比如,回答一個具體問題:2003 年在洛杉磯 Quality 咖啡館拍過電影的導(dǎo)演是誰?
要回答這一問題,首先需要 System 1 找到相關(guān)的影片,然后 System 2 做出決策,如果是標準答案,就結(jié)束整個推理過程;如果不是,而相應(yīng)的信息又有用,就把它作為一個有用信息提供給 System 1,System 1 繼續(xù)做知識擴展,System 2 則再次做出決策,直到找到最終答案。
由此可見,認知圖譜的核心是以實現(xiàn)融合知識驅(qū)動和數(shù)據(jù)驅(qū)動相結(jié)合的知識表示和推理的認知引擎為目標,研究支持魯棒可解釋人工智能的大規(guī)模知識的表示、獲取、推理與計算的基礎(chǔ)理論和方法;建設(shè)包含語言知識、常識知識、世界知識、認知知識的大規(guī)模知識圖譜以及典型行業(yè)知識庫,建成知識計算服務(wù)平臺。
機遇與挑戰(zhàn)并存
近年來,雖然 AI 已經(jīng)取得了快速發(fā)展,但如何將深度學(xué)習(xí)與大規(guī)模常識知識結(jié)合起來,實現(xiàn)認知推理與邏輯表達,還面臨著很大挑戰(zhàn)。
研發(fā)融合常識知識圖譜、認知推理和邏輯表達等核心技術(shù)的認知圖譜將成為實現(xiàn)下一代 AI 技術(shù)突破的關(guān)鍵,實現(xiàn)以認知圖譜作為底層數(shù)據(jù)支撐,具有推理、具有可解釋性、具有認知的新一代 AI,是 AI 領(lǐng)域下一個 10 年重要的發(fā)展方向,也是一個機遇與挑戰(zhàn)并存的發(fā)展方向。
眾所周知,技術(shù)的突破與發(fā)展離不開來自人才的持續(xù)創(chuàng)新,科技競爭歸根結(jié)底也是人才的競爭。那么,放眼中國乃至全世界,認知圖譜領(lǐng)域的人才在哪里?
近日,清華大學(xué)人工智能研究院、北京智源人工智能研究院、清華-中國工程院知識智能聯(lián)合研究中心、阿里集團-新零售智能引擎事業(yè)群聯(lián)合發(fā)布了《人工智能之認知圖譜》(Research Report of Cognitive Graph)報告(文末福利,免費下載完整版報告)。該報告依托 AMiner 平臺,對技術(shù)領(lǐng)先的國家、機構(gòu)和學(xué)者,以及認知圖譜相關(guān)領(lǐng)域的技術(shù)發(fā)展趨勢、技術(shù)創(chuàng)新熱點等進行了詳細分析。
數(shù)據(jù)顯示,全球范圍內(nèi)認知圖譜相關(guān)領(lǐng)域的學(xué)者主要集中在北美、歐洲和亞洲。美國的高水平學(xué)者數(shù)量在全球位居首位,其次是中國,第三是英國。
其中,中美兩國的高水平學(xué)者數(shù)量遠高于其他國家,在認知圖譜相關(guān)領(lǐng)域具有較強的發(fā)展?jié)摿。中國雖然僅次于美國,但是高水平學(xué)者數(shù)量約是美國的一半,相差較大。
圖 | h-index TOP 5000 全球?qū)W者的國家統(tǒng)計前 10 名
而國內(nèi)認知圖譜相關(guān)領(lǐng)域?qū)W者主要分布在中國的經(jīng)濟和政治發(fā)達地區(qū),包括京津冀、長江三角洲、珠江三角洲、香港、臺灣等地區(qū),中部、西部和東北地區(qū)的學(xué)者則相對較少。
具體而言,北京、上海和江蘇的認知圖譜相關(guān)領(lǐng)域?qū)W者數(shù)排名前三位,分別為 129、45 和 36。(參考 h-index 作為篩選條件,選擇 TOP 5000 全球?qū)W者以地圖形式展示和分析學(xué)者的地區(qū)分布,其中顏色越紅、圓圈越大,表示人才越集中。)
圖 | h-index TOP 5000 中國學(xué)者的省市統(tǒng)計前 10 名
而且,美國在認知圖譜相關(guān)領(lǐng)域的論文發(fā)表量和總被引頻次、高水平學(xué)者數(shù)量均位居世界前列。中國雖然在論文發(fā)表量和高水平學(xué)者數(shù)量方面僅次于美國,但與美國差距較大,并且論文總被引頻次要低于英國和德國,在全球排名第四。
圖 | 論文總被引頻次排名前 10 的國家
此外,報告還基于 AMiner 平臺將學(xué)者流入和流出數(shù)量之和作為篩選條件,統(tǒng)計了認知圖譜相關(guān)領(lǐng)域的全球?qū)W者在2009年—2020年間的流動數(shù)量排名前 10 的國家。
數(shù)據(jù)顯示,美國、加拿大、法國的學(xué)者流入數(shù)量大于流出數(shù)量,而中國、英國、德國、意大利、印度、日本、西班牙的學(xué)者流出數(shù)量大于流入數(shù)量。
圖 | 全球認知圖譜領(lǐng)域?qū)W者的流動情況(來源:報告《人工智能之認知圖譜》)
由此看出,中國近 10 年來的學(xué)者流動較為頻繁,這與中國制定的出國培養(yǎng)、人才引進等相關(guān)人才政策不無關(guān)系。隨著經(jīng)濟全球化深入發(fā)展,科技人才的跨國流動更加頻繁,各國對科技人才的爭奪更加激烈。
那么,國內(nèi)認知圖譜相關(guān)領(lǐng)域的學(xué)者分布情況又如何呢?
數(shù)據(jù)顯示,北京是學(xué)者流入和流出數(shù)量都很高的城市,比其他城市高出較多,這可能與北京的高校和科研院所數(shù)量較多有一定關(guān)系。此外,北京、香港、上海、哈爾濱的學(xué)者流出數(shù)量高于流入數(shù)量,而武漢、南京、西安、杭州、廣州、合肥的學(xué)者流入數(shù)量高于流出數(shù)量。北京、香港、上海的學(xué)者流失與這三個城市的高校數(shù)量較多、供求關(guān)系不平衡、人才競爭力和生活壓力較大不無關(guān)聯(lián),而哈爾濱的地域環(huán)境造成了一定的學(xué)者流失。針對學(xué)者凈流入數(shù)量為正值的這幾個城市,通過調(diào)研相關(guān)資料,可以發(fā)現(xiàn)這些地方在積極推行人才引進政策,包括落戶、房補、薪酬等方面均制定了相應(yīng)的優(yōu)惠措施。
圖 | 中國認知圖譜領(lǐng)域?qū)W者的流動情況(來源:報告《人工智能之認知圖譜》)
以上分析表明,在下一代 AI 的機遇與挑戰(zhàn)下,中國相關(guān)部門需要重視并采取相關(guān)措施,讓中國學(xué)者在重視論文數(shù)量的同時,也要提升論文質(zhì)量,同時也要加快高水平科技人才隊伍的建設(shè),一方
針對國際新局勢從政策、資金、資源等多個方面加快本土培養(yǎng),另一方面加大力度引進國外重要機構(gòu)的杰出學(xué)者,改善人才結(jié)構(gòu),加速認知圖譜領(lǐng)域的技術(shù)發(fā)展。
未來 10 年,具有推理、具有可解釋性、具有認知的新一代 AI,是 AI 領(lǐng)域的下一個重要發(fā)展方向,而研發(fā)融合常識知識圖譜、認知推理和邏輯表達等核心技術(shù)的認知圖譜將成為實現(xiàn)下一代 AI 技術(shù)突破的關(guān)鍵,但歸根結(jié)底還要依靠相關(guān)人才基于不懈努力做出的創(chuàng)新。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?