一、本文介绍
本文记录的是利用iRMB
模块优化YOLOv12
的目标检测网络模型。iRMB(Inverted Residual Mobile Block)
的作用在于克服了常见模块无法同时吸收CNN 效率建模局部特征和利用Transformer 动态建模能力学习长距离交互的问题。相比一些复杂结构或多个混合模块的方法,能更好地权衡模型成本和精度。本文将其用于v12
的模型改进和二次创新,更好地突出重要特征,提升模型性能。
文章目录
二、iRMB注意力介绍
Rethinking Mobile Block for Efficient Attention-based Models
2.1 设计出发点
- 统一CNN和Transformer优势:从高效的Inverted Residual Block(IRB)和Transformer的有效组件出发,期望在基础设施设计层面整合两者优势,为注意力模型构建类似IRB的轻量级基础结构。