1张GPU就能让静态图片变gif-图片,GPU ——快科技(驱动之家旗下媒体)--科技改变未来

正文内容 评论（0）

1张GPU就能让静态图片变gif

2021-08-10 14:03:46 出处：量子位作者：鱼羊编辑：随心评论(0)

#GPU #图片

自打伯克利和谷歌联合打造的NeRF横空出世，江湖上静态图变动图的魔法就风靡开来。

1张GPU就能让静态图片变gif

不过，想要像这样依靠AI来简化3D动态效果的制作，算力开销可不小：

以NeRF为例，想要在1440 x 1600像素、90Hz的VR头盔中实现实时渲染，需要37 petaFLOPS（每秒10^15次浮点运算）的算力——这在目前的GPU上根本不可能实现。

怎么降低点计算复杂度？

现在，来自奥地利格拉兹科技大学和Facebook的研究人员，就想出一招：引入真实深度信息。

就这一下，很快的，推理成本最高能降低48倍，并且只用1个GPU，就能以每秒20帧的速度实现交互式渲染。

画质什么的，也没啥影响，甚至还能有所提升：

1张GPU就能让静态图片变gif

具体是怎样一招，咱们往下接着聊。

基于深度预言网络的NeRF

首先需要说明的是，NeRF，即神经辐射场（neural radiance field）方法，是沿相机射线采样5D坐标，来实现图像合成的。

1张GPU就能让静态图片变gif

也就是说，在NeRF的渲染过程中，需要对每条射线都进行网络评估，以输出对应的颜色和体积密度值等信息。

这正是造成NeRF在实时渲染应用中开销过大的主要原因。

而现在，格拉兹科技大学和Facebook的研究人员发现，引入真实深度信息，只考虑物体表面周围的重要样本，每条视图射线（view ray）所需的样本数量能够大大减少，并且不会影响到图像质量。

基于此，他们提出了DONeRF。

DONeRF由两个网络组成，其一，是Sampling Oracle Network，使用分类法来预测沿视图射线的最佳采样位置。

具体来说，这个深度预言网络通过将空间沿射线离散化，并预测沿射线的采样概率，来预测每条射线上的多个潜在采样对象。

如下图所示，3个颜色通道编码了沿射线的3种最高采样概率，灰度值表明其中可能只有一个表面需要被采样，而彩色数值则表明这些样本需要在深度上展开。

其二，是一个着色网络，使用类似于NeRF的射线行进累积法来提供RGBA输出。

为了消除输入的模糊性，研究人员还将射线转换到了一个统一的空间，并使用非线性采样来追踪接近的区域。

另外，在两个网络之间，研究人员对局部采样进行扭曲，以使着色网络的高频预测被引导到前景上。

本文还引入了视图单元（view cell）的概念。一个视图单元被定义为一个具有主要方向和最大视角的边界框。

简单来说，这个边界框能够捕捉到所有源于框内、并且在一定旋转范围内的视图射线。

利用这样的方法，就可以对大场景进行分割，解决NeRF没有办法应用于大场景的问题。

此外，较小的视图单元减少了场景中的可见内容，因此可能会进一步提高成像质量。

对比结果

所以，DONeRF相较于前辈NeRF，到底能快多少?

不妨直接来看对比结果。

1张GPU就能让静态图片变gif

在相似的质量下，NeRF总共使用了256个样本。而DONeRF只用到了4个样本，在速度上可以实现20-48倍的提升。

并且在成像细节方面，DONeRF的图像边缘更为清晰。

研究人员还指出，在16个样本的情况下，从峰值信噪比（PSNR）来看，几乎所有场景中DONeRF都超越了NeRF。

传送门

论文地址：https://arxiv.org/abs/2103.03231

项目地址：https://depthoraclenerf.github.io/

责任编辑：随心文章纠错

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#GPU #图片

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波