正文内容 评论(0)
近段时间发布的小米10系列影像能力得到了颇多关注,其中小米10 Pro参与了DxOMark测试,得分为124分,是目前DxOMark排行榜第一名,表现优秀。
不只是后置一亿主摄+2000万超广角+800万长焦+1200万人像四摄的强大硬件,小米10 Pro AI算法方面的发力也弥足重要,AI相机是小米AI影像能力全面提升的一个代表作。
2月19日,小米AI相机核心研发工程师汪轩然发布了关于小米10 Pro AI相机的详细技术帖,介绍了其背后隐藏的一些技术难点和挑战。
据小米联合创始人,副董事长林斌介绍,汪轩然是2010年就加入小米的软件技术大咖,两年多前他开始负责小米相机的软件算法研发,这两年小米影像的技术进步,与该团队的贡献密不可分。
接下来就让我们一起了解一下,以下是小米汪轩然原帖全文:
小米10发布会上,新一代小米AI相机是小米10pro中AI影响的一个重头戏,是小米AI影像能力全面提升的一个代表作。作为这个功能的核心研发工程师,我来给大家介绍一下这个特性背后隐藏的一些技术难点和挑战。
AI相机作为一个概念并不新鲜,早在小米8的时代我们就推出了第一代小米AI相机。传统的AI相机的做法,通常分成两个部分,一是识别,二是后处理。
前者通过神经网络来“认知”当前拍摄的场景,后者根据不同的场景,使用一些传统的方式来针对特定场景做一些优化,比如加一些特殊的滤镜。所谓“AI“,其实只有前面的识别部分跟AI挂钩。这种方式最大的问题是只能针对特定的几个预设好的场景来做优化,并且针对同一个场景,只能采用一样的模板来处理,而没有针对当前的色彩,光影等做一些更有针对性的局部优化,效果会大打折扣。
为了解决这一问题,我们团队开创性的将传统的场景感知拓展成为全方位的色彩、对比度、光影等内容感知,使用深度神经网络对整个画面进行全局和局部的分析,获取到最优的画面效果,并且实时地对画质进行增强。所以AI大片是覆盖所有场景的优化。可以说,新的AI相机,对于同样的一片草地,在不同的光照,角度,甚至背景下,都会有不一样的优化效果。并且我们的技术把识别+处理合二为一,一站式的实现了AI修图师的效果。
这个技术最大的挑战在于计算量。众所周知,针对图像像素处理的深度神经网络的计算量极高,对手机的计算能力是一个很大的考验,而我们除了要实现预览实时处理,所见即所得的效果之外,更“变态“的要求能针对一亿像素的原片进行处理。
为了实现这两个看似不可能的任务,团队的攻城狮们对于神经网络的优化达到了每个四则运算都去细抠的程度。除了使用常见的网络减枝,网络压缩的技术,我们还创造性地提出了一种新的基于导向图的开关网络结构,这个网络不仅仅可以使得网络参数和计算量大幅下降,也可以满足优化的多样性要求(噪声,亮度,颜色,对比度,高动态等等),最终得以将全新的AI相机展现给用户。
除了攻城狮哥哥们的辛勤努力,新的AI相机也包含了团队中很多设计师妹子们的心血。为了让深度神经网络能完美的复现出修图师的美化效果,我们给网络“喂“了数十万张训练数据,并同时做了多套效果,最终通过盲评,选择了一个认可度最高的模型效果。
发布会的几页ppt,背后隐藏的是团队每个成员日日夜夜的辛苦付出。小米影像技术起步的确有点晚,但我们一直都在很努力的往前跑着。在我们的眼中,没有什么友商,没有什么销量,我们只想着怎么用最新的技术来让拍照变得更加有趣,让每个人都能拍出一张好照片,借此让大家的生活能变得美好一点点,仅此而已。我们会继续努力。
处理前
处理前
处理后
处理前