正文内容 评论(0)
六、总结:不止强于语音 讯飞开启“视觉输入法”的大门
正如我们在前文所说,常规的键盘输入不太容易满足移动端面临的复杂工作和生活场景,不同人群的多样化需求促生了新的输入方式。这可能便是讯飞输入法在常见的拼音、语音、手写之外开发“拍一下”输入方式的动力之一。
目前,讯飞输入法Android和iOS最新版均提供智能拍照输入,从实际体验来看:智能拍照输入支持手机拍照或者从相册图片直接提取文字,不仅能够提高录入效率,较高的识别正确率能够规避手动录入出错的风险,看到大段文字以原有排版瞬间完成录入的感觉相当畅快。
而且,智能拍照输入不光支持中英这两种常见的语言,对于日、韩、德等小语种,甚至是中英混合文本也能做到“所拍即所得”。实际体验当中发现,此功能对拍照距离、纸面弯曲情况、清洁状况都没有苛刻要求,基本能做到随手一拍就能识字。
对于习惯手写记录和抄笔记的人来说,讯飞输入法也具有相当高的可用性,其能够识别手写体甚至是中英文混合手写体,也能快速生成Word/excel等Office文件,减少整理誊写到电子版这一过程当中所需的巨大工作量。
很多数学公式包含的符号甚至是展示方式(比如“二分之一”的数学书写方式)在手机上很难录入,而讯飞输入法提供了一键拍照数理公式完整识别的功能。
不止于此,随着文字识别和公式识别精度越来越高,智能拍照输入还加入对小学数学题的智能批改,学生家长只要对着孩子作业题拍照,就能自动判卷,节省心力。
值得一提的是,讯飞并不想单纯满足于图文识别的功能实现,还加入了翻译功能。日常当中常见的资料、菜单、路标、说明书等,拍一下即翻译成中文。
在笔者看来,我们所使用的讯飞输入法其实更像是一个聚合着讯飞前沿技术和成熟方案的超级战舰——除了智能语音技术地位众所周知,讯飞的视觉技术同样无法小视:
其在ICDAR ReCTS评测任务中刷新了全部四项识别榜的世界纪录;在ICFHR 2020 OffRaSHME数学公式识别挑战赛中获冠军;在计算机视觉顶级会议CVPR 2019和文档分析与识别顶级会议ICDAR 2019上的多项评测任务中获冠军;在ICPR2018 MTWI图文识别挑战赛中包揽全部三项任务冠军。
整体来看,讯飞输入法此次于行业内首发的智能拍照输入,一方面是视觉技术领域的“秀肌肉”;另一方面对于普通用户来说,确实是贴合工作学习的信息提取录入痛点,提高内容输出效率,值得下载体验一番。