以文本方式查看主题

-  课外天地 李树青  (http://njcie.com/bbs/index.asp)
--  信息检索原理课件  (http://njcie.com/bbs/list.asp?boardid=16)
----  哈工大讯飞联合实验室发布中文阅读理解数据集  (http://njcie.com/bbs/dispbbs.asp?boardid=16&id=1730)

--  作者:admin
--  发布时间:2016/7/19 15:27:40
--  哈工大讯飞联合实验室发布中文阅读理解数据集

2016年7月18日,哈工大讯飞联合实验室(HFL)发布填空型中文阅读理解数据集,其中包括《人民日报》新闻数据集和“儿童读物”数据集(HFL-RC: People Daily and CFT dataset)。
 
在英文阅读理解方面,已有Google DeepMind CNN/Daily Mail数据集,Facebook CBTest数据集,但一直缺少中文阅读理解数据集。此次,HFL发布的数据集不但填补了中文阅读理解的空白,而且与上述两个英文数据集不同,在HFL发布的“儿童读物”数据集中还包含了人工问题,人工问题比自动构造的问题更难回答,这为阅读理解的研究提出了新的挑战。
 
此外,他们还设计了一种简单有效的神经网络来解决填空型阅读理解问题,并获得了良好的效果。
哈工大讯飞联合实验室(HFL)发力研究“阅读理解”这个备受业界关注的人工智能难题,相关成果将陆续发布。


论文已发布在arXiv:网页链接
数据集地址:网页链接

 

[此贴子已经被作者于2016-07-19 15:28:06编辑过]