主要的点是
三个稀疏不变操作处理稀疏输入和特征图,分别是稀疏不变平均值、稀疏不变上采样、联合稀疏不变连接和卷积
多尺度融合结构
稀疏不变双线性上采样:
输入和掩码进行点乘,然后进行双线性上采样操作
掩码单独进行双线性上采样操作,获得和点乘后一样的特征图大小,
再将特征图和掩码进行点对点的相除,获得新的特征图,
掩码中有值为1,反之为零,获得新的掩码
稀疏不变平均
两个相同大小的特征图先各自与各自的掩码进行点乘,再相加
两个特征图的掩码进行点对点相加
相加后的特征图与相加后的掩码进行相除,获得新的特征图
两个特征图的掩码进行或运算得到新的掩码
联合稀疏不变连接和卷积
先将两个输入特征图按照通道方向进行叠加,然后使用文章定义的卷积核进行1x1卷积,卷积核定义如下
对这个卷积核我的理解是,假如说一个像素点,x的特征图的掩码是1,y的特征图的掩码是0,就取用x特征图的权重,反之取y特征图的权重,如果都是1则取平均,也就是用上面说的稀疏不变平均来进行计算
掩码则是和稀疏不变平均一样,让两个特征图的掩码进行或运算得到新的掩码
网络框架结构:
一个是RGB引导的,一个则只有深度图作为输入
RGB引导的结构除了最后的联合有不同,其他都是一样的结构
这里的二尺度融合结合和三尺度融合结构有点新颖
可以借鉴