HRNet
目前主流多尺度特征提取一般是将高分辨率特征图下采样至低分辨率,再将低分辨率特征图经上采样恢复至高分辨率。主流网络结构图如下所示:
在下采样和上采样过程中对应的相同尺度特征图通过虚线进行连接,旨在融合低级和高级的特征。在级联金字塔中,结合了通过卷积处理的低级和高级特征。在特征提取过程中,下采样是为了产生低分辨率特征图,提取高级语义信息;上采样恢复过程是为了得到高分辨的表示。在最终的高分辨率特征图的热图中计算目标的关键点。
HRNet不同,在整个特征提取过程中,始终保持特征图的高分辨率,希望在整个过程中都有高分辨率特征图,没有分辨率恢复的过程。在实现多尺度特征提取的过程中,在高分辨率特征图主网络逐渐并行加入低分辨率特征图子网络,不同网络实现多尺度融合与特征提取。示意图如下所示,
横向为depth变化,纵向为scale变化。第一行为主干网络,特征图保持高分辨率水平,作为第一阶段。后面逐渐并行加入分辨率子网络建立更多的阶段**(不同分辨率子网)**。各个并行网络之间相互交换信息,实现多尺度的特征融合和特征提取。最终预测图所估计的关键点是在高分辨率主干网络进行输出。
这种全新的多尺度特征提取方式有两个优势。首先,采用并行的方法连接高分辨特征网络和低分辨特征网络