Bootstrap

2025/2/22论文阅读

一,《MixFormer: A Mixed CNN-Transformer Backbone for Medical Image Segmentation》

           一种用于医学图像分割的混合CNN-Transformer骨干网络

创新点--

  • 混合CNN-Transformer骨干网络:本文提出了一种混合CNN-Transformer(MixFormer)特征提取骨干网络,在下采样过程中无缝集成了Transformer的全局上下文信息和CNN的局部细节信息

  • 多尺度空间感知融合(MSAF)模块:让模型能够同时捕捉图像中不同尺度的信息。

  • 混合多分支扩张注意力(MMDA)机制:在编码和解码阶段之间提出,让模型在处理图像时能够更灵活地关注不同区域,用于弥合语义差距并强调特定区域

  • 基于CNN的上采样方法恢复低级特征并提高分割精度。

MSA模块:多头自注意力模块;MLP:多层感知器

二,多模态大模型相关知识理解

;