正文内容 评论(0

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界
2021-06-28 15:08:10  作者:文路 编辑:文路     评论(0)点击可以复制本篇文章的标题和链接

6月28日,计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓,阿里巴巴视觉算法团队成绩领跑全球,共斩获16项世界冠军,覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景,多项研究可帮助盲人感知物理世界、识别农业领域灾害等。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

CVPR是AI领域最顶级的学术会议之一,会议每年都会吸引全球顶级高校及Google、微软、Facebook等科技企业参加,近几年,该会议的主题逐渐从单纯的学术交流延伸至学术与应用结合的探索,而中国企业也迎来了高光时刻,在论文数量级竞赛冠军数上均有不俗表现。

据悉,阿里巴巴达摩院视觉实验室、手淘算法等团队此次参与了多项高难度视觉任务竞赛,最终在16项竞赛中击败国内外科技公司及高校,斩获16项世界冠军。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

AI基于视频生成前后连贯的句子描述

在ActivityNet Dense Video Captioning竞赛中,参赛团队算法需要基于一段视频生成前后连贯的句子描述,以帮助盲人理解视频内容。在该竞赛中,达摩院创新性采用SOTA视频网络及多模态特征融合,同时解决了事件序列描述的问题,可高效AI理解视频内容,最终以METEOR score 10.33的成绩获得第一名。在另外两项竞赛中,达摩院AI算法还准确识别了盲人拍摄的低清晰度照片,帮助盲人看清图片内容。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

达摩院AI Earth精准识别农作物生长过程中的干旱、洪涝等农业灾害

视觉技术在农业场景的探索是近两年的热门话题,在本届CVPR中,达摩院包揽了AGRICULTURE-VISION CHALLENGE监督和半监督两大赛道冠军。竞赛需要参赛团队基于遥感航拍影像来识别农业灾害,例如农作物生长过程中的干旱、洪涝等农业灾害类型。达摩院AI Earth采用了对抗学习、颜色语义引导、域归一化和双表征网络等方法,有效解决弱纹理、样本不平衡、颜色敏感、跨域等难题。未来,该算法可应用于精准农业、农业资产盘点、农业灾害定损等领域。

视频行为理解是一直都被认为是一项非常具有挑战性的任务,达摩院针对该问题研发了技术框架EMC2,解决了视频背景复杂、视频人物相互遮挡及视频分辨率不足等干扰问题,最终在ActivityNet、AVA-Kinetics、Epic-Kitchens、HACS等视频理解竞赛中获得5项冠军。据介绍,该技术体系已在视频搜索、版权保护、视频交互等场景使用。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

基于达摩院EMC2技术体系的算法斩获5项冠军

达摩院参赛团队表示,“计算机视觉领域的研究热点每年都在变化,AI算法需要面临的任务场景也越来越复杂,单纯的算法创新很难在实际问题中有好的表现,我们的算法融合了多项创新技术,并且在视频会议、农业、电商等领域大规模使用。”

据介绍,达摩院在CVPR期间还主办了第二届大规模商品图像识别竞赛,最终共有623支队伍报名注册,冠军模型识别准确率超去年10%。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:文路文章纠错

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#阿里巴巴

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...