訂閱
糾錯
加入自媒體

車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)

本周要跟大家分享的是來自TechBeat社區(qū)的一篇優(yōu)質(zhì)好文。本文中,車萬翔教授從ACL的投稿及錄用趨勢,到各個研究領(lǐng)域的發(fā)展現(xiàn)狀,都發(fā)表了自己的一些看法,希望對相關(guān)領(lǐng)域的研究者能有所幫助!

導(dǎo)讀:

2020年5月23日,有幸受邀在中國中文信息學(xué)會青年工作委員會主辦的AIS(ACL-IJCAI-SIGIR)2020頂會論文預(yù)講會上介紹了ACL會議近年來的研究趨勢,特整理成幻燈片配文字版,希望對相關(guān)領(lǐng)域的研究者有所幫助。由于視野所限,時間倉促,特別是ACL 2020的錄用論文列表剛發(fā)布不久,因此統(tǒng)計的數(shù)據(jù)和得出的結(jié)論難免有失偏頗,如有不當(dāng)之處,還敬請指出。另外,特別感謝組內(nèi)的多位博士生幫助進(jìn)行數(shù)據(jù)整理。

首先來看一下2010年到2020年這11年來,ACL長文的錄用情況和趨勢,可以看出從2018年開始,投稿和錄用的數(shù)量急劇上升,說明作為人工智能皇冠上的明珠,自然語言處理領(lǐng)域越來越受到研究界的關(guān)注。另外,ACL的錄用率多年來基本保持穩(wěn)定,一直在25%左右。

車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)

再來看一下今年錄用文章標(biāo)題的詞云,從中可以看出大家關(guān)注比較多的任務(wù)有生成、翻譯、對話、問答、抽取、句法等方向,用到的方法多涉及到神經(jīng)、網(wǎng)絡(luò)、注意力、圖等。另外,從文章作者的詞云可以看出前幾名的基本都是中國的大姓,這也反應(yīng)出華人作者在ACL頂會上已經(jīng)占據(jù)非常大的比例。

車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)

為了更直觀的了解近年來ACL各個研究領(lǐng)域的變化趨勢,我們做了一個領(lǐng)域趨勢競賽圖,幫助大家更好地看出各個研究領(lǐng)域此消彼長的變化過程。特別說明的是,我們的領(lǐng)域是參考ACL 2019進(jìn)行劃分的,由于其它年份的領(lǐng)域劃分方式不盡相同,我們采用人工的方式進(jìn)行了映射。另外,由于2020年目前只有文章列表,還沒有領(lǐng)域數(shù)據(jù),所以也是人工逐篇文章分的類,因此具有一定的主觀性,有可能不是特別準(zhǔn)確。

從這段視頻中,我們可以看到幾個非常明顯的趨勢,比如人機(jī)對話等新興領(lǐng)域上升勢頭迅猛,而句法分析、機(jī)器翻譯等傳統(tǒng)領(lǐng)域有所衰落。下面,就幾個變化比較明顯的領(lǐng)域分別加以介紹。

人機(jī)對話異軍突起

2015年之前,ACL上幾乎沒有人機(jī)對話的文章發(fā)表,但是從2016年開始,隨著語音識別技術(shù)的突破,NLPer開始重視人機(jī)對話的研究,今年ACL該方向上的研究重點(diǎn)和研究趨勢如下圖所示。

車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)

機(jī)器學(xué)習(xí)持續(xù)熱門

可以看到近10年來,機(jī)器學(xué)習(xí)的熱度一直居高不下,特別是隨著預(yù)訓(xùn)練模型的成功,NLP模型大有被大一統(tǒng)的趨勢。下面的一些機(jī)器學(xué)習(xí)研究方向?yàn)榻衲闍CL所重點(diǎn)關(guān)注。

車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號