車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)
文本生成強勢上升
嚴格來講自然語言處理應(yīng)被分為自然語言處理和自然語言生成兩個方向,然而受到技術(shù)的限制,傳統(tǒng)的文本生成多采用基于模板的方法,因此在研究上并沒有引起太多的關(guān)注。隨著序列到序列模型的產(chǎn)生,人們意識到可以采用類似的方法進行逐詞的文本生成,從而產(chǎn)生了大量的研究和應(yīng)用問題,因此文本生成也成為了目前自然語言處理的熱門研究領(lǐng)域。今年ACL上的研究熱點如下圖所示。
問答系統(tǒng)絕地反擊
隨著斯坦福大學(xué)SQuAD數(shù)據(jù)集的誕生,以抽取式閱讀理解為代表的問答系統(tǒng)近年來引起了大量的關(guān)注。但是為什么說是“絕地反擊”呢?主要是因為在更久之前,問答系統(tǒng)就曾經(jīng)是信息檢索和自然語言處理領(lǐng)域的熱門研究方向,但是受限于當(dāng)時的技術(shù)手段,答案準確率并不是很高,因此該研究方向曾一度被人們所冷落。經(jīng)過這幾年的發(fā)展,問答系統(tǒng)的模型逐漸被預(yù)訓(xùn)練模型所統(tǒng)一,因此今年ACL上的相關(guān)文章更關(guān)注問答系統(tǒng)的各個子任務(wù)或引入更多資源。
新任務(wù)和資源挑戰(zhàn)機器
仍然是受預(yù)訓(xùn)練模型的影響,在很多剛被提出不久的自然語言處理任務(wù)上,機器的表現(xiàn)很快超過人類。因此最近有大量的研究工作試圖提出對機器更具有挑戰(zhàn)性的任務(wù)和資源,從而逼迫機器更像人一樣“思考”。
機器翻譯有所衰落
幾家歡樂幾家愁,由于上述領(lǐng)域的快速崛起,更重要的是由于模型逐漸為Transformer所統(tǒng)一,使得機器翻譯這一“老牌”自然語言處理任務(wù)受關(guān)注的程度有所降低。今年ACL的相關(guān)研究也分散到不同的翻譯場景設(shè)置上。
句法分析逐漸式微
和機器翻譯類似,句法分析這一曾經(jīng)自然語言處理領(lǐng)域的當(dāng)家任務(wù)也逐漸式微。其背后的原因有兩個:一方面是因為Biaffine Parser的出現(xiàn)證明了結(jié)構(gòu)學(xué)習(xí)這一自然語言處理的特色問題,對于句法分析并不重要;另一方面,預(yù)訓(xùn)練模型的出現(xiàn)使得句法分析的處境更是雪上加霜。預(yù)訓(xùn)練模型不但能大幅提高句法分析的效果,更重要的是其內(nèi)部已經(jīng)蘊含了句法結(jié)構(gòu)信息,因此就無需為下游任務(wù)提供顯式的句法結(jié)構(gòu)了。由于這些原因,今年ACL上句法分析的熱點也主要集中在了研究探針任務(wù)和句法分析的應(yīng)用上了。不過蘇州大學(xué)李正華老師所提出的高階TreeCRF模型還是能進一步提升句法分析的效果,這一點非常難得。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 光計算迎來商業(yè)化突破,但落地仍需時間
- 5 大模型下半場:Agent時代為何更需要開源模型
- 6 中國“智造”背后的「關(guān)鍵力量」
- 7 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?
- 8 營收猛增46%,昆侖萬維成為AI“爆品工廠”
- 9 全球無人駕駛技術(shù)排名:誰才是細分賽道的扛把子?
- 10 地平線自動駕駛方案解讀