继AlphaGo挑战李世石4:1获胜之后,阿里云也在人工智能领域向人类发起挑战。
近日,阿里云在2016年会上公开展示实时语音识别技术,并现场挑战世界速记大赛亚军得主。据现场最终评测,机器人在准确率上以0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军、马云“御用”速记姜毅。
阿里云年会现场,图中左边屏幕显示的是语音识别,右边屏幕显示的是人工速记
从现场效果看,人工智能的稳定性和并发计算能力是其优势。人类的体力是有极限的,尤其是在高强度压力下,工作时间越长出错概率越大,而机器则能自始至终保持同一水平。这一点在AlphaGo和李世石的围棋比赛终中也反复得到验证,在比赛中、后局机器的稳定计算能力远超人类。
此外,人工智能的并发能力也非人工所能及。在发现错别字后,机器可以瞬间修改所有错误,人工速记则需要在演讲人短暂间歇的时刻返回修改,明显表现得慌乱。
阿里云iDST 语音组总监鄢志杰表示,虽然已经在接近世界一流的“速记师”的路上,但人工智能还有很长一段路要走。“在噪声、口音以及对未见到过的数据的适应性上,人类显然更胜一筹。”
速记师姜毅则评价,虽然和人工智能比赛压力很大,但“机器还是缺了一点点智慧”,并表示非常愿意收下这个“机器徒弟”,教会它更多的速记诀窍。
“看起来是机器挑战人类,其实是人类在挑战自己。”姜毅强调,“人工智能背后凝结的科学家智慧是人类的骄傲。”
第50届国际速联速记大赛于2015年在匈牙利布达佩斯举办,姜毅作为中国代表队的九名选手之一,在文本看打速记比赛项目中以大约300字/分钟的速度获世界亚军。
核心算法+GPU计算
所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。
随着自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口,苹果Siri等是个人智能助理类典型应用。而语音识别则是人机交互的第一步。
据介绍,此次“人机大战”的语音识别算法主要基于BLSTM(双向长短时记忆神经网络),这种算法对单位时间内的计算量要求很高,因此阿里云采用了带GPU加速的新一代高性能计算平台,单节点计算能力达16 Tflops,并且对BLSTM算法做了针对性优化,实时解码更为顺畅。
走出实验室赋能应用
阿里云iDST智能语音团队拥有世界一流的专家团队,此次年会展示的研发成果只是冰山一角。实际上语音技术已经走出实验室,在阿里内部广泛应用,比如赋能阿里集团客服和蚂蚁金服客服团队的呼叫中心智能化。
去年双11,蚂蚁金服95%的远程客户服务已经由大数据智能机器人完成,同时实现了100%的自动语音识别。蚂蚁金服客户中心整体服务量超过500万人次,客服人员的精力可以更好地集中到处理复杂类客户问题和工作。
同时,语音团队还把智能语音交互技术赋能给YunOS以及手机淘宝、支付宝、钉钉等移动端应用。