点击上方,选择星标或置顶,每天给你送干货!
阅读大概需要9分钟
跟随小博主,每天进步一丢丢
来自 | 知乎
地址 | https://www.zhihu.com/question/358469127/answer/1028144909
作者 | Scofield
编辑 | 机器学习算法与自然语言处理公众号
本文仅作学术分享,若侵权,请联系后台删文处理
我也从自己学习的历程做个总结吧。
论文:
1.首先强推thunlp组总结的机器阅读理解相关论文,里面目前有70+篇机器阅读理解相关的论文,从最开始2014年左右的Memory networks、Attention Sum Reader Network等到2018年的BERT都有总结。预训练模型出现之前,很多工作都是在做各种各样的Attention机制,目的还是如何更好地强化问题和文档之间的交互,如下图。
2.向之前的答主一样推荐陈丹琦大佬的博士论文《Neural Reading Comprehension and Beyond》和国防科大的《Neural Machine Reading Comprehension: Methods and Trends》,如果没有很多时间一一阅读thunlp总结的机器阅读理解论文的话,这两篇可以带你快速的了解机器阅读理解相关的数据集、模型、方法等。
3.近些年兴起的融入外部知识的机器阅读理解相关论文总结。
大佬(排名无先后顺序):
我关注的国内的比较多,国外的MRC大佬了解的比较少,所以暂时推荐几个国内的MRC大佬,也是看他们的论文一路过来。
1.陈丹琦
2.崔一鸣
3.胡明昊
4.张倬胜
5.刘璟
6.more...
机器阅读理解排行榜:
自己在平时读论文时总结了一个机器阅读理解相关数据集的排行榜,有英文和中文两种,欢迎push,经常也会看下排行榜上的SOTA模型,然后去找该论文拜读。
中文机器阅读理解竞赛:
1.CMRC 2019/2018/2017
CMRC 2019也是首次公布了类似英语考试阅读理解“7选5”类型的阅读理解数据集。
2.DuReader 2.0/1.0
中文类型的开放领域QA数据集。
3.成语阅读理解大赛
ChID: A Large-scale Chinese IDiom Dataset for Cloze Test 首次提出了中文成语阅读理解数据集。
4.莱斯杯:全国第二届“军事智能机器阅读”挑战赛 目前公开的首个带推理类型的中文机器阅读理解数据集。
5.法研杯CAIL2019
SQuAD 2.0类型的中文机器阅读理解数据集。
6.more...
开源框架:
1.搜狗阅读理解框架,实现了多种非预训练机器阅读理解模型以及在SQuAD、CoQA等数据集上的测试。
2.more...
视频:
都是在B站上找到的。。。
1.陈丹琦博士答辩视频。
2.PaperWeekly × 清华大学:计算未来轻沙龙——机器阅读理解。
3.more...
欢迎各位大佬指正与补充~
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦