正文内容 评论(0

国际残疾人日:科技正在帮助残疾人消除生活中的障碍
2020-12-03 11:29:36  作者:安妮 编辑:安妮     评论(0)点击可以复制本篇文章的标题和链接

联合国发布的数据显示,目前全世界超过70亿人口中,约有10亿以上的人,也就是相当于总人口约15%的人患有某种形式的残疾。因为无障碍设施和服务的不完善,这些人常常更多地待在家中,远离公共空间,难以融入社会。为了在社会和发展的各个领域促进和维护残疾人的权利和福祉,并提高人们对残疾人处境的认识,1992年,联合国大会第47/3号决议宣布将每年的今天,也就是12月3日,定为国际残疾人日。

国际残疾人日:科技正在帮助残疾人消除生活中的障碍

在数字化和智能设备普及的时代,残疾人应该能平等地享受科技进步的带来的成果。正因如此,在开发产品和提供服务时,有越来越多的科技公司开始充分考虑残障用户的需求。例如,作为一家极为重视产品“包容性”和“无障碍优先”的设计思路的大型科技公司,Google开发的几款应用程序和人工智能模型,就结合了众多先进技术,让手机成为了盲人和视障人士的“眼睛”,耳聋和听障患者的“耳朵”,并帮助聋哑人更好地在视频会议中表达自己。

通过手机摄像头识别商品

在商店或超市挑选商品,是日常生活中再普通不过的一部分,然而,对于盲人或者视力障碍人士而言,要想在包装完全一致(盒装、罐装、瓶装......),因而触感也相同的商品中找到自己需要的那一款却并非易事。Lookout是Google于2018年宣布推出的一款可以帮助这一人群识别周边环境的产品,今年,为了让他们能更快速、容易地处理日常事务,Google更新了这项应用程序,推出了识别食品标签的功能。现在,当用户将智能手机的摄像头对准产品时,Lookout会自动识别产品上的文字,并可以播放出相关信息,如品牌名称、产品规格、营养成分等。

国际残疾人日:科技正在帮助残疾人消除生活中的障碍

这一功能得益于Lookout内置的带有索引的产品检测和识别模型,以及基于Mediapipe(Google开发的为实时和流媒体提供跨平台、定制化机器学习解决方案的工具)的目标跟踪和光学字符识别(OCR)模型。为了让这项功能更加易用,Google专门构建了一个由高达200万种的产品组成的数据库,让产品检测和识别模型可以完全在设备上运行,降低延迟,同时减少对网络连接的依赖。在光学字符识别方面,Google则选择了利用神经网络技术为每幅图像生成一个大小仅有64字节的全局描述符,与传统的局部图像匹配和文本匹配等方法相比,这一解决方案需要的存储空间要小得多,让应用程序能够容纳更多产品信息。

在此次更新中,Lookout还新增了扫描文档功能,可以拍摄文档快照,识别其中的文字,让屏幕阅读器可以朗读出其详细内容,方便盲人和视障人士浏览文档和信件。

将语音准确转录为文字的应用

耳聋和听障人士在社会交往中常常需要依赖价格昂贵、需要预约的人工转录服务。自动语音识别(ASR)技术的出现,让智能设备可以将语音自动转换为文本,给人们提供了与他人保持实时沟通的可能性。

为了让耳聋和听障人士更加独立地进行日常对话,Google于2019年推出了免费Android应用Live Transcribe,可以为会话实时配上字幕。在这款应用中,Google构建了基于Google Cloud的自动语音识别系统,并添加了基于设备上神经网络的语音检测器,该语音检测器可以检测语音并自动管理与云端ASR引擎的网络连接,将长时间使用Live Transribe的数据流量消耗降至最低。由此,自动语音识别技术可以“走入寻常百姓家”,让更广大的人群受益。

国际残疾人日:科技正在帮助残疾人消除生活中的障碍

同样在去年发布的Live Caption,则能自动为在Android手机上播放的音频或视频配上字幕,让耳聋和听障人士也能享受数字媒体带来的便利和快乐。通过三个位于设备上的深度学习模型,这款应用可以在不连接网络的情况下完成转录语音、生成标点符号、识别声音事件(如“掌声”、“音乐声”等)等任务,进而准确、高效地输出实时字幕。

让视频会议程序可以检测手语

因为新冠肺炎疫情,视频会议成为了各大公司普遍采用的一种工作方式。然而,大部分视频会议程序的自动跟踪发言人功能(也就是突出显示发言人)只能识别出正在大声讲话的人,那些使用手语的残疾人可能很难得到说出自己想法的机会。

为了应对这一挑战,Google的研究人员构建了一个实时手语检测系统,利用姿势估计模型PoseNet,这一系统聚焦于用户在使用手语时活动的主要身体部位,包括眼睛、鼻子、肩膀、手等,通过计算这些部位的光流,量化用户的动作,判断出用户是否在使用手语。因为这一系统只检测那些最必要的信息,所以它的体量很小,在运行中消耗的CPU周期也很少,可以很容易地整合进视频会议应用中。

国际残疾人日:科技正在帮助残疾人消除生活中的障碍
图中黄色图表即为系统对用户是否在使用手语的判断

在检测到用户正在使用手语后,它会通过虚拟音频电缆向视频会议程序发送人类听觉范围之外的超声音频,让其将手语使用者判定为发言人。

我们可以从Google的这些工作中看到,科技的发展如何能帮助残疾人消除生活中的障碍,缩短他们在生活中与普通人的距离。《残疾人权利公约》确认,障碍的存在是残疾问题的核心,对残疾人的无障碍和包容性是所有残疾人的基本权利,而一个残疾人能够全面地参与社会生活的社会,最终也将有益于所有人的进步和发展。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:安妮文章纠错

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...