Bootstrap

YOLOv12改进策略【Conv和Transformer】| ICCV-2023 iRMB 倒置残差移动块 轻量化的注意力模块(二次改进A2C2f)

一、本文介绍

本文记录的是利用iRMB模块优化YOLOv12的目标检测网络模型iRMB(Inverted Residual Mobile Block)的作用在于克服了常见模块无法同时吸收CNN 效率建模局部特征和利用Transformer 动态建模能力学习长距离交互的问题。相比一些复杂结构或多个混合模块的方法,能更好地权衡模型成本和精度。本文将其用于v12的模型改进和二次创新,更好地突出重要特征,提升模型性能。


二、iRMB注意力介绍

Rethinking Mobile Block for Efficient Attention-based Models

2.1 设计出发点

  • 统一CNN和Transformer优势:从高效的Inverted Residual Block(IRB)和Transformer的有效组件出发,期望在基础设施设计层面整合两者优势,为注意力模型构建类似IRB的轻量级基础结构。
;