一,《MixFormer: A Mixed CNN-Transformer Backbone for Medical Image Segmentation》
一种用于医学图像分割的混合CNN-Transformer骨干网络
创新点--
-
混合CNN-Transformer骨干网络:本文提出了一种混合CNN-Transformer(MixFormer)特征提取骨干网络,在下采样过程中无缝集成了Transformer的全局上下文信息和CNN的局部细节信息。
-
多尺度空间感知融合(MSAF)模块:让模型能够同时捕捉图像中不同尺度的信息。
-
混合多分支扩张注意力(MMDA)机制:在编码和解码阶段之间提出,让模型在处理图像时能够更灵活地关注不同区域,用于弥合语义差距并强调特定区域。
-
基于CNN的上采样方法:恢复低级特征并提高分割精度。
MSA模块:多头自注意力模块;MLP:多层感知器