Bootstrap

深度学习之图像分割—— u2-net基本思想和网络结构以及论文补充

u2-net的引入

在这里插入图片描述
针对的任务是SOD任务(显著性目标检测)

1.什么是SOD任务

在这里插入图片描述
特点:只有前景和背景

2.网络结构

1.主要思想

主要思想:大的unet中又嵌套的小的unet
在这里插入图片描述

2.重要模块

主要以RSU-7和RSU-4F为主
在这里插入图片描述

1.RSU-7

在这里插入图片描述

5.RSU-4F

在这里插入图片描述
en-5、en-6、en-7使用的是RSU-4F,因为en-4裁剪的图片已经很小了,如果再继续裁剪,那么会失去很多的上下文信息。所以把结构中的上采样下采样模块都换成了膨胀卷积。d2、d4分别代表膨胀系数是2和4。

3.显著图融合模块

在这里插入图片描述
如何进行融合,最终生成我们最后需要的融合特征图?
每一层通过一个33的卷积层,他们的通道数都是等于1的,再通过双线性差值的方法把图片还原到输入图像的一个尺寸,然后把6层的特征图进行一个拼接,最后再通过一个11的卷积层和sigmoid的函数生成最后的一个预测概率图。

3.u2net和轻量型的u2net它们的一个详细配置

在这里插入图片描述
实验结果对比图
在这里插入图片描述

4.损失函数

在这里插入图片描述
前一部分对应的就是sup1-sup6,这6个图通过sigmoid激活函数得到对应的预测概率图,然后再与我们手工标注的gt去计算它的损失l,这里的l代表的都是二值交叉熵损失函数,这里的M是6。后一部分指的的最终得到的一个预测特征图和GT的一个损失

5.评价指标

在这里插入图片描述
Fβ、MAE的值是在0-1之间的,数值越大效果越好。

6.DUTS数据集(显著性目标检测)

在这里插入图片描述
在这里插入图片描述

;