Bootstrap

NeRF与3D Gaussian的异同对比

NeRF(Neural Radiance Fields)和3D Gaussian Splatting是两种不同的3D场景表示与渲染技术,分属两个派系。那他两有啥区别呢?核心区别在于场景的表示方式、优化目标及渲染效率。

1. 核心区别

特性NeRF3D Gaussian Splatting
表示方式隐式表示:通过神经网络(MLP)学习场景的辐射场(颜色和密度)。显式表示:用3D高斯分布显式建模场景中的点云或粒子。
优化目标最小化渲染图像与真实图像的误差(基于体渲染积分)。通过点云参数优化(位置、协方差、颜色等),实现高效渲染。
渲染速度慢(需逐点积分,依赖神经网络推理)。快(基于光栅化,适合实时渲染)。
内存与计算开销训练时间长,推理速度慢,但参数紧凑。显存占用高(需存储大量高斯参数),但渲染高效。
适用场景高质量静态场景重建、新视角合成。动态场景、实时渲染(如VR/AR、游戏)。

2. 输入与输出

(1) NeRF
  • 输入

    • 多视角图像:一组已知相机位姿(位置和朝向)的RGB图像。

    • 相机参数:包括内参(焦距、畸变等)和外参(位姿矩阵)。

  • 输出

    • 神经辐射场模型:一个神经网络,输入3D坐标 (x,y,z)和视角方向 (θ,ϕ),输出该点的颜色 (r,g,b)和密度 σ。

    • 新视角图像:通过体渲染(Volume Rendering)积分生成的任意视角的RGB图像。

(2) 3D Gaussian Splatting
  • 输入

    • 点云或初始3D数据:可能来自深度传感器(如LiDAR)或多视角重建的稀疏点云。

    • 多视角图像(可选):用于优化高斯参数(如颜色、协方差)。

  • 输出

    • 3D高斯集合:每个高斯由以下参数定义:

      • 位置 (x,y,z)。

      • 协方差矩阵(定义高斯分布的形状和方向)。

      • 颜色 (r,g,b) 和透明度(或权重)。

    • 渲染图像:通过光栅化(Splatting)将3D高斯投影到2D屏幕,快速生成图像。

3. 关键技术对比

(1) NeRF的关键技术
  • 体渲染积分:沿光线采样点,通过神经网络预测颜色和密度,积分生成像素颜色。

  • 位置编码:将3D坐标和视角方向编码为高频信号,提升细节表现。

  • 网络结构:多层感知机(MLP)隐式建模场景。

(2) 3D Gaussian Splatting的关键技术
  • 协方差优化:通过梯度下降调整高斯的形状和方向以匹配多视角图像。

  • 光栅化加速:利用GPU并行性高效投影高斯到屏幕空间。

  • 动态场景支持:通过高斯参数的时间变化建模动态物体。

4. 典型应用场景

  • NeRF

    • 高保真静态场景重建(如文化遗产数字化)。

    • 电影特效中的新视角合成。

    • 虚拟试穿、室内场景建模。

  • 3D Gaussian Splatting

    • 实时AR/VR渲染(如Meta Quest 3)。

    • 游戏引擎中的动态粒子特效。

    • LiDAR点云实时可视化(如自动驾驶)。

5. 优缺点总结

技术优点缺点
NeRF渲染质量高,细节丰富;参数紧凑。训练和推理慢;动态场景支持弱。
3D Gaussian Splatting渲染速度快;支持动态场景和实时交互。显存占用高;对初始点云质量敏感。

6. 如何选择?

  • 选择NeRF:需要高质量静态场景重建,且可接受离线训练。

  • 选择3D Gaussian:需要实时渲染(如AR/VR)或处理动态场景。

两者也可以结合使用(如用NeRF初始化高斯分布),以平衡质量与效率。

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;