正文内容 评论(0

一年拿10个世界冠军!哈工大讯飞联合实验室刷新SQuAD2.0新纪录
2018-11-23 10:05:34  出处:快科技 作者:随心 编辑:随心     评论(0)点击可以复制本篇文章的标题和链接

日前,在新揭晓的SQuAD2.0排行榜上,哈工大讯飞联合实验室团队(HFL)从谷歌(Google AI)、阿里达摩院(Alibaba DAMO)、微软亚洲研究院(Microsoft Research Asia)等业界翘楚中脱颖而出,获得今年的第10个世界冠军。

一年拿10个世界冠军!哈工大讯飞联合实验室刷新SQuAD2.0新纪录
SQuAD2.0最新榜单(截至2018.11.22)

据了解,SQuAD(Stanford Question Answering Dataset)是认知智能行业内公认的机器阅读理解领域的顶级水平测试,通过吸收来自维基百科的大量数据,SQuAD构建了一个包含十多万问题的大规模机器阅读理解数据集,这使得在这个数据集上训练大规模复杂算法成为可能。

本次参测的SQuAD2.0相比此前的SQuAD1.1,在基于篇章片段抽取的阅读理解任务的基础上进一步提高了解答难度,对机器阅读理解模型提出了新的挑战。

其难度主要在于在新版本数据集中加入了“不可回答的问题”,即参赛团队所提交的机器阅读理解模型需要通过阅读篇章和问题,判断所提出的问题是否能够通过篇章内容进行回答,如果可以回答,则根据篇章中的内容作出答案;如果不可回答,则需要对题目进行拒答。

一年拿10个世界冠军!哈工大讯飞联合实验室刷新SQuAD2.0新纪录

在本次提交的系统中,哈工大讯飞联合实验室所提交的模型在EM指标达到82.374,EM(Exact Match,即精准匹配率),预测答案和真实答案完全匹配,即机器给出的答案需要和人一样才算正确)。

F1指标达到85.310,F1(F1-score,模糊匹配率),即将答案短语切成词,与人类答案共同计算回归率和准确性,如果机器模型的答案并没有完全匹配也可以得分,用以表示评测模型的整体性能)上,进一步缩小了机器与人类认知水平在该数据集上的效果差距。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:文章纠错

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#科大讯飞

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...