車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)
本周要跟大家分享的是來自TechBeat社區(qū)的一篇優(yōu)質(zhì)好文。本文中,車萬翔教授從ACL的投稿及錄用趨勢,到各個研究領(lǐng)域的發(fā)展現(xiàn)狀,都發(fā)表了自己的一些看法,希望對相關(guān)領(lǐng)域的研究者能有所幫助!
導(dǎo)讀:
2020年5月23日,有幸受邀在中國中文信息學(xué)會青年工作委員會主辦的AIS(ACL-IJCAI-SIGIR)2020頂會論文預(yù)講會上介紹了ACL會議近年來的研究趨勢,特整理成幻燈片配文字版,希望對相關(guān)領(lǐng)域的研究者有所幫助。由于視野所限,時間倉促,特別是ACL 2020的錄用論文列表剛發(fā)布不久,因此統(tǒng)計的數(shù)據(jù)和得出的結(jié)論難免有失偏頗,如有不當(dāng)之處,還敬請指出。另外,特別感謝組內(nèi)的多位博士生幫助進(jìn)行數(shù)據(jù)整理。
首先來看一下2010年到2020年這11年來,ACL長文的錄用情況和趨勢,可以看出從2018年開始,投稿和錄用的數(shù)量急劇上升,說明作為人工智能皇冠上的明珠,自然語言處理領(lǐng)域越來越受到研究界的關(guān)注。另外,ACL的錄用率多年來基本保持穩(wěn)定,一直在25%左右。
再來看一下今年錄用文章標(biāo)題的詞云,從中可以看出大家關(guān)注比較多的任務(wù)有生成、翻譯、對話、問答、抽取、句法等方向,用到的方法多涉及到神經(jīng)、網(wǎng)絡(luò)、注意力、圖等。另外,從文章作者的詞云可以看出前幾名的基本都是中國的大姓,這也反應(yīng)出華人作者在ACL頂會上已經(jīng)占據(jù)非常大的比例。
為了更直觀的了解近年來ACL各個研究領(lǐng)域的變化趨勢,我們做了一個領(lǐng)域趨勢競賽圖,幫助大家更好地看出各個研究領(lǐng)域此消彼長的變化過程。特別說明的是,我們的領(lǐng)域是參考ACL 2019進(jìn)行劃分的,由于其它年份的領(lǐng)域劃分方式不盡相同,我們采用人工的方式進(jìn)行了映射。另外,由于2020年目前只有文章列表,還沒有領(lǐng)域數(shù)據(jù),所以也是人工逐篇文章分的類,因此具有一定的主觀性,有可能不是特別準(zhǔn)確。
從這段視頻中,我們可以看到幾個非常明顯的趨勢,比如人機(jī)對話等新興領(lǐng)域上升勢頭迅猛,而句法分析、機(jī)器翻譯等傳統(tǒng)領(lǐng)域有所衰落。下面,就幾個變化比較明顯的領(lǐng)域分別加以介紹。
人機(jī)對話異軍突起
2015年之前,ACL上幾乎沒有人機(jī)對話的文章發(fā)表,但是從2016年開始,隨著語音識別技術(shù)的突破,NLPer開始重視人機(jī)對話的研究,今年ACL該方向上的研究重點(diǎn)和研究趨勢如下圖所示。
機(jī)器學(xué)習(xí)持續(xù)熱門
可以看到近10年來,機(jī)器學(xué)習(xí)的熱度一直居高不下,特別是隨著預(yù)訓(xùn)練模型的成功,NLP模型大有被大一統(tǒng)的趨勢。下面的一些機(jī)器學(xué)習(xí)研究方向?yàn)榻衲闍CL所重點(diǎn)關(guān)注。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?