Bootstrap

水下图像增强现有的方法总结

        大家好!本人打算以后对水下图像增强类的文章进行讲解(含部分代码),以及和大家分享一下怎么写这类的文章。希望大家多多支持,觉得博主讲的还行的可以点个关注,谢谢大家。以下是水下图像增强的主要三种方法:基于非物理模型、基于物理模型与基于深度学习的方法

一、基于非物理模型的方法

          目前基于非物理模型主要是基于这四种模型做的:图像金字塔融合,小波融合,多任务融合,引导滤波融合。做的最多的目前就是图像金字塔融合(2018年第一篇图像金字塔横空出世),剩下三种都是目前比较少人在水下图像做的,如果考虑发论文建议后面三种,图像金字塔融合目前比较饱和,再发的话难度比较大了。  所谓融合,顾名思义就是将两种图像进行融合,取各自图像的优缺点。

二、基于物理模型的方法

        基于物理模型的方法将水下图像增强视为图 像退化的逆问题。这些方法通常先建立一个物理 的水下图像退化模型,然后根据各种先验假设估计 未知的环境光模型参数和传输参数。最后,通过反 演这一退化过程,可以得到高质量的图像(这类方法对公式推导以及数学要求较高,相对三种模型,此类方法是比较难创新的)。

三、基于深度学习的方法

        卷积神经网络(CNN)在水下图像增强领域的运用已经证明了其在特征提取和图像处理方面的卓越能力。CNN通过其多层级结构模拟了人脑的局部感知功能,同时,通过非线性激活函数的引入,增强了网络的表现力。此外,池化层和Dropout技术的结合使用,有效地抑制了过拟合现象。

        生成对抗网络(GAN)的创新之处在于通过两个相互竞争的神经网络(生成器和判别器)来学习数据的分布。在这一过程中,生成器致力于产生与真实样本高度相似的合成样本,而判别器则专注于识别这些合成样本与真实样本之间的差异。这两个网络通过对抗训练,逐渐提升生成器生成真实数据的能力,形成一个动态平衡。

        Transformer的核心优势在于其自注意力机制。自注意力机制允许模型在处理图像的某个部分时,能够关注到图像的其他部分。这对于水下图像特别重要,因为水下环境可能会导致图像的不同区域出现各种光学效应(如散射或模糊)。通过自注意力,模型能够理解和修复这些效应,提升图像的整体质量。

四、总结

        如果考虑发TOP的建议往Transformer方向靠,因为近几年大模型很火热都是基于Transformer的,而且据我的检索,水下图像增强第一篇Transformer是2020年好像,U型Transformer。到现在这方面的论文不算多,所以可以往这边靠拢。如果考虑发的是三区,四区建议可以往非物理模型靠(非物理模型的组合比深度学习容易,直接组合即可,而深度学习中你把别人的某个模块移植过来进行创新 需要改卷积尺寸,通道尺寸,以及后面的代码都会收到影响),而物理模型对于我数学基础不是特别好的人来说难度较大,而且做这方面的相对较少,代码难实现等。大家觉得我讲的通俗易懂的,可以给我一个免费的点赞吗,谢谢大家了!后续为大家讲解代码以及论文的阅读

;