正文内容 评论(0)
在2020年当代好设计奖评审中,百度智能云AI人机交互实验室设计并研发数字人系列产品从国内外众多硬件产品中脱颖而出,斩获2020中国当代好设计奖。
当代好设计奖(Contemporary Good Design Award,简称CGD)是由德国红点奖机构主办的国际化设计大奖,每年吸引包括小米、联想、戴尔等国内外顶尖品牌的产品参与角逐,当代好设计奖评审流程基于红点奖60余年专业评审经验,由国际资深评审注重每个产品是否达到国际顶尖标准,而不是参赛产品之间的较量。旨在评选出杰出的在创新度、前沿性、实用性兼具的产品。
本次获奖的数字人云屏是百度数字人技术商业化应用场景下的创新产品。数字人云屏结合了人像建模技术、感知引擎、认知引擎等人工智能技术,具有对物理世界的感知、认知与表达能力。虚拟数字人以云屏为载体,在屏幕中以1:1比例呈现,带来全新的人机交互体验,在金融、广电、教育、营销、医疗、零售、游戏等行业中,都有着广泛的应用场景, 成为更温暖,更有人情味的AI服务触点。
不同于传统的大屏幕硬件,数字人云屏的外观设计与屏幕内的数字人形象需要深度耦合,使数字人云屏能够为更好地实现数字人的整体体验而服务。
还原1:1的真实体验感
数字人的本质是模拟真人交互能力与体验,代替真人提供服务。云屏作为用户与数字人交互的媒介,还原真实人物身高尺寸比例是人机交互体验的基础。为了实现这样的效果,百度设计团队通过一比一投影对比实验、服务业身高数据偏好调研,将数字人身高定义在168cm,并反推出适合的屏幕尺寸比例。目前应用在百度数字人云屏上的屏幕是由百度联合供应链资源共同研发定制的特殊尺寸。定制的屏幕尺寸避免,当数字人在相同高度的传统屏幕中显示时,左右留白过多的空旷感,以及过大的屏幕宽度对后期现场部署的空间限制。
轻薄、自然、科技感
数字人云屏具有纤薄的机身,机身边框采用了非常独特的圆弧内凹设计,使得机身侧面层次分明,富于光感,同时边框视觉上也更加轻薄。业界首创的极简纤细底座,突破了传统大屏幕厚重的底座设计,使得底座近乎消隐在用户视野中,用户的注意力可以完全聚焦在屏幕中的数字人形象上。渐变的喇叭孔设计,使得黑色的孔洞于白色机身过渡自然,弱化视觉的存在感。所有的造型处理都是为了尽可能弱化屏幕硬件本身的视觉存在感,突出数字人本身。
人性化的细节处理
传统大屏幕基本都采用黑色的屏幕玻璃丝印,然而这种处理方式与竞品相比无法形成差异化,且科技感有余,亲和力不足。基于此,我们选择工艺要求更高的白色屏幕玻璃丝印,配合业内通透性最好的玻璃基材,实现了非常纯粹的牙白色玻璃效果。舒适内敛的牙白色屏幕玻璃与优雅的数字人形象配合,呈现出完美的整体视觉体验。同时,屏幕采用防眩光玻璃,保证屏幕在复杂的光线环境下,不会出现干扰数字人显示的反光。
屏幕的底座除了在造型上极简纤细之外,整体还采用了磨砂亚光的浅灰色铝氧化效果,既有高级且低调的金属质感,也能够和白色的屏幕有所区隔,进一步强化屏幕的视觉中心地位。
基于用户不同场景的功能和场地需求,数字人云屏包含有:72寸、65寸、55寸、43寸不同版本和2种不同的安装固定方式。
百度数字人云屏OS服务于公共场所场景
众所周知,OS是用于管理硬件和软件,并提供通用服务的计算机程序,百度数字人云屏作为软硬一体的智能产品,其系统是一个内置了固定应用软件的大型泛用程序,与传统的嵌入式系统不同,它天生自带AI基因,在此基础上可定制丰富多样的应用功能。
Windows服务于办公场景,其office办公三件套至今已超三十年,继续作为现代社会的生产工具;iOS服务于移动互联网场景,最大特点是随时随地即刻满足当代人群的各类需求;DuerOS服务于家居场景,小度智能音箱出货量千万台,走进千家万户,为用户提供生活场景下的贴心服务,还有小度车载OS服务于驾驶场景,百度数字人云屏OS则服务于公共场所场景。
通过对公共场所服务场景(含银行、医院、展馆、政务大厅、商场与商铺等)的设计分析,在系统架构上,底层是百度的AI技术,有语音技术、图像识别、NLP、知识图谱等,中间层是软硬一体的产品与功能,上层是基于各行业服务场景的解决方案。
在系统的使用场景上划分三层,分别是“高频层”、“低频层”和“定制层”,对应的使用者是“店员”、“运营人员”和“开发人员”。
在现实场景下的服务是会有不可预估的随机性出现,而往往服务触点的切入机会也藏在其中,此时恰当的解决方案是“人机协同”,通过“店员”简单操作让智能交互屏拥有“恰逢其时”的服务抓手,对此在云屏上就能进行使用高频的功能做配置调整。
· 3D壁纸,不仅能更好的融入场景,还能抓住节假日的时间点提升场景适应性。
(更换壁纸GIF图1)
· 叫卖播报,主动展示信息吸引用户注意,结合数字人的动作、表情、声音来提升其吸引力。播报内容配置简单,在设备上就能实时的操作,可根据自身要求调整播放时段和频次,做到有的放矢的播报内容。
(叫卖播报GIF图1)
(叫卖播报GIF图2)
· 主动迎宾,主动发起欢迎与信息推荐,当有用户走来时,数字人能主动进行迎宾接待,以及主动推荐信息。迎宾内容配置简单,在设备上就能实时的操作,可根据接待的来宾,做对应的欢迎词和推荐信息的内容配置。
· 数字人换装,换套衣服换个发型,为顾客来宾提供焕然一新的高颜值服务。
(换装GIF图1)
在公共场所的服务场景下,问询服务是一个基础的通用功能,系统提供一问一答与多轮问答编排的后台能力,“运营人员”做一次问答内容的录入,可持续应用于该场景之下。另外还提供营销工具,在某个时间段内做营销活动,也属于低频的一次配置,相对于一段时间内智能化使用。
· 问答后台
一问一答
简约的标准问与回答,对应UIKit组件
多轮问答编排
流程编排
15项预置技能
预置技能
· 营销后台,全网18类热门营销玩法,丰富服务触点的抓手能力。
营销活动
对于一些服务场景,需要定制化开发对应的功能,对此我们提供完整的开发者工具包,让AI技术的调用变得更简单。
从看见到使用,都符合人们的自然认知习惯
有赖于AI技术日新月异的发展,在语音交互领域接近做到使用人们日常生活所用的自然语言作为交互媒介,只要会说话就能交互。所以,我们基于理想状态下软硬一体的技术实现能力,提出百度数字人云屏的设计目标——“符合人们认知习惯的自然交互”。
当人们面对着数字人云屏,可以说绝大多数是第一次接触这个“新物种”,设计上要做好联想牵引,引导成这是一个“数字服务员”,为了达成这个认知状态,设计上需要从接纳用户到衔接真实,在现阶段我们采取“从现实环境过度到拟物场景”的设计思路,衔接好人们的习惯认知自然落到数字人云屏上,尽可能的降低大众的认知挑战,降低产品使用的阻力。
对此我们做了多套的3D虚拟场景搭建,力求融入各类服务场景的现实之中。另外还精雕细琢的创建“数字人”,从长相、发型、妆容、服装、动作等都符合服务场景下所期待的高颜值数字形象。
3D场景建模
多套发型
在认知上我们解决“歧义问题”,在交互上我们要顺应人们自然的行为,为此我们提出在云屏所放置的区域存在着人们习惯的交互空间,结合霍尔人机空间理论,以及使用我们在HCII发表的论文《Stepped Warm-up--The Progressive Interaction Approach for Human-Robot Interaction in Public》其公共场所下人-机器人的渐进式研究的结论,同时融合数字人云屏智能传感器的识别能力,搭建百度数字人云屏在公共场所下的交互分区。
播报态,吸引过路用户的注意力,向公共域的流量做引流。
主动态,服务触点的切入与转化的关键点,提供主动迎宾与信息推荐。
交互态,免唤醒词全双工语音交互是交互态的核心,通过线型麦克风阵列和单目摄像头人脸图像的多模动态识别,实现在嘈杂环境下的免唤醒语音交互,这大大提高了用户与云屏的语音交互效率和主观满意度。
在实现上,我们针对近场做语音识别的算法增强优化,在云屏朝前45cm-120cm范围内,实现近场语音交互识别的增益区。另外通过百度实验室模拟环境做语音交互识别测试,在安静环境下其总句准率为95.25%,在容噪环境下其总句准率为93.03%。
为了进一步提升用户与数字人云屏的语音交互体验,在语音交互细节上深入打磨,划分四个状态,分别是不可语音、可以语音、语音输入中和语音解析中。
另外还提供按键式语音交互,防备在极端环境下的设备可用,同时该按键交互兼容单击与长按,对于习惯触屏交互的人群而言,不管是单击还是长按都是正确的。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...