分析显著性目标检测--Global Context-Aware Progressive Aggregation Network for Salient Object Detection
引入
显著目标检测的目的是检测感兴趣的区域吸引。显著目标检测作为一种高效的预处理技术,在图像理解、图像还原和目标跟踪等领域具有广泛的应用价值。
语义信息:是信息的表现形式之一,指能够消除事物不确定性的有一定意义的信息。
全卷积网络(FCN)通过叠加多个卷积层和池化层,逐步扩大网络的接受域,提取高级语义信息。如以往作品所指出,由于金字塔状的CNNs结构,低层特征通常具有更大的空间尺寸和更细粒度的细节,而高层特征往往获得更多的语义知识,丢弃一些无意义或不相关的细节信息。一般来说,高层特征有利于突出目标的粗定位,而包含空间结构细节的低层特征适合细化边界。然而,基于FNC的方法存在以下几个问题:(1)由于不同层次特征之间的差异,语义信息与外观信息的简单结合不够充分,缺乏考虑不同特征对显著性目标检测的不同贡献;(2)以往的研究大多忽略了全局上下文信息,但这一部分有利于推断多个显著区域之间的关系,产生更完整的显著性结果;
为了解决上述问题,我们提出了一种新的网络名为全局上下文感知渐进聚合网络(GCPANet),该网络由四个模块组成:特征交织聚合(Feature Interweaved Aggregation, FIA)模块、自我细化(Self - refinaved, SR)模块、Head Attention(HA)模块和全局上下文流(Global Context Flow, GCF)模块。
FIA:考虑到多级特征之间的特征差异,我们设计了FIA模块,将高级语义特征、低级细节特征和全局上下文特征充分融合,期望在抑制噪声的同时恢复更多的结构和细节信息。在第一个FIA模块之前,我们在骨架的顶层增加了一个HA模块,以加强突出物的空间和通道响应。
SR:在聚合之后,特性将被输入到SR模块中,通过利用特性中的内部特性来精炼特性映射。
GCF:考虑到上下文信息有利于捕获多个显著对象之间或显著对象不同部分之间的关系,设计了一个GCF模块,从全局的角度利用关系,有利于提高显著对象检测的完整性。
HA模块:利用空间注意和通道注意来减少信息冗余,增强顶层特征,自细化(SR)模块进一步细化和增强输入特征;
如下图所示,该方法可以处理一些具有挑战性的场景,如复杂的场景理解(高亮度天花板干扰),或多目标关系推理(乒乓球拍和球)。
方法
网络概述
如图所示,本文网络为对称的编解码器体系结构