正文内容 评论(0

持续发力AI领域 搜狗刷新ICDAR2019榜单三项新记录
2019-11-08 16:36:32  作者:CLY 编辑:CLY     评论(0)点击可以复制本篇文章的标题和链接

近日,搜狗在OCR识别权威比赛ICDAR2019挑战中,刷新了任意形状文字识别(ArT)中检测、识别、端到端三项任务的新记录,充分体现了搜狗在文字识别领域的领先优势。

[MD:Title]

ICDAR国际文档分析与识别比赛是图像领域文本检测与识别的权威赛事,备受业界关注。ICDAR2019-ArT是在2019年提出的新任务,因其任务的高挑战性,吸引了旷视、华为、阿里等传统强队参与。与往年的赛事任务不同的是,2019年的数据集旨在推动任意形状文字检测和识别技术的发展与创新,因此数据层面聚焦在任意形状,特别是不规则场景文字的检测与识别,这就要求算法框架具有更高的鲁棒性。而且,该数据集为自然场景图像,场景类型覆盖面大、背景复杂,同时存在大量非规则形状文字,是目前业界最大的任意形状场景文字数据集,复杂性和难度更大。

[MD:Title]

在本次任务中,搜狗采用了基于实例分割的文字检测方法,训练及测试过程中引入了掩码融合、打分机制优化、多尺度等技术。针对文字识别,搜狗以主流的Encoder-Decoder技术作为框架,以SE-ResNet作为Encoder骨干网络,引入薄板样条插值算法(TPS)和通道注意力机制(Channel-Attention),创新性地将残差思想引入多层Bi-LSTM中,不同层的LSTM特征通过残差连接进行特征融合,增强了模型的鲁棒性。在Decoder模块中,采用注意力解码机制实现对特征解码识别。

文字检测与识别技术在实际生活中有广泛的应用,如扫描录入、拍照搜题、拍照翻译、路标识别等。搜狗OCR技术在众多垂直领域落地,满足着广大用户多样化、个性化需求,帮助用户提升输入的效率,在搜狗翻译及输入法等产品中得到用户的广泛使用和好评,并同时为vivo等合作伙伴赋能。

搜狗此次刷新ICDAR2019-ART榜单的成绩,是其在OCR领域持续耕耘的结果,也是在AI领域的能力体现。未来,搜狗还将不断扩展技术成果的落地场景,带给用户更多切实便利及惊喜体验。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:文章纠错

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...