阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界-阿里巴巴 ——快科技(驱动之家旗下媒体)--科技改变未来

正文内容 评论（0）

阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界

2021-06-28 15:08:10 作者：文路编辑：文路评论(0)

6月28日，计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓，阿里巴巴视觉算法团队成绩领跑全球，共斩获16项世界冠军，覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景，多项研究可帮助盲人感知物理世界、识别农业领域灾害等。

阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界

CVPR是AI领域最顶级的学术会议之一，会议每年都会吸引全球顶级高校及Google、微软、Facebook等科技企业参加，近几年，该会议的主题逐渐从单纯的学术交流延伸至学术与应用结合的探索，而中国企业也迎来了高光时刻，在论文数量级竞赛冠军数上均有不俗表现。

据悉，阿里巴巴达摩院视觉实验室、手淘算法等团队此次参与了多项高难度视觉任务竞赛，最终在16项竞赛中击败国内外科技公司及高校，斩获16项世界冠军。

阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界

AI基于视频生成前后连贯的句子描述

在ActivityNet Dense Video Captioning竞赛中，参赛团队算法需要基于一段视频生成前后连贯的句子描述，以帮助盲人理解视频内容。在该竞赛中，达摩院创新性采用SOTA视频网络及多模态特征融合，同时解决了事件序列描述的问题，可高效AI理解视频内容，最终以METEOR score 10.33的成绩获得第一名。在另外两项竞赛中，达摩院AI算法还准确识别了盲人拍摄的低清晰度照片，帮助盲人看清图片内容。

阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界

达摩院AI Earth精准识别农作物生长过程中的干旱、洪涝等农业灾害

视觉技术在农业场景的探索是近两年的热门话题，在本届CVPR中，达摩院包揽了AGRICULTURE-VISION CHALLENGE监督和半监督两大赛道冠军。竞赛需要参赛团队基于遥感航拍影像来识别农业灾害，例如农作物生长过程中的干旱、洪涝等农业灾害类型。达摩院AI Earth采用了对抗学习、颜色语义引导、域归一化和双表征网络等方法，有效解决弱纹理、样本不平衡、颜色敏感、跨域等难题。未来，该算法可应用于精准农业、农业资产盘点、农业灾害定损等领域。

视频行为理解是一直都被认为是一项非常具有挑战性的任务，达摩院针对该问题研发了技术框架EMC2，解决了视频背景复杂、视频人物相互遮挡及视频分辨率不足等干扰问题，最终在ActivityNet、AVA-Kinetics、Epic-Kitchens、HACS等视频理解竞赛中获得5项冠军。据介绍，该技术体系已在视频搜索、版权保护、视频交互等场景使用。

阿里斩获16项CVPR冠军三项研究帮助盲人“看见”世界