目录
2 YOLOv5中加入Deformable Attention模块
2.3 创建添加优化点模块的yolov5x-C3-DAttention.yaml
1 Deformable Attention模块原理
思路主要来源于可变形卷积DCN,理解起来很容易,就是保持不变,针对每个学习一个位置偏差,取该处的特征值即可。
上面一张图展现了四种网络的特点:
- ViT中所有的感受野是一样的,都针对全局所有位置特征;
- Swin中则是局部Attention,因此处于不同窗口的两个针对的感受野区域是不一样的;
- DCN则是针对周围九个位置学习偏差,之后采样矫正过的特征位置,可以看到图中红点蓝点数量均为9;
- 本文提出的DAT则结合了ViT和DCN,所有的会共享相同的感受野,但这些感受野会有学出来的位置偏差;为了降低计算复杂度,针对的特征数量也会降采样,