Pelee阅读学习笔记

1.论文阅读：

【MobileNet、ShuffleNet、MobileNet v2等相继被提出，这些模型都过度依赖于depthwise卷积，而深度可分离卷积缺乏高效实现】

本文主要工作：

【遵循了Desenet的连接模式和一些关键性的设计原则；能够满足对内存和计算预算的限制】

特点如下：

如下图所示，受GoogLeNet启发，使用2-way dense layer来获得不同尺度的感受野。

One way 使用1个3X3的卷积

The other way使用两个堆叠的3X3卷积层来学习大目标的visual patterns

如下图所示，受Inception-v4和DSOD的启发，提出一种低成本的stem block。

用于第一个dense layer之前提取特征

能够提升特征表达能力，且没有增加太多的计算成本

bottleneck中的通道数量根据输入feature map的形状而变化，并不是像Densenet中直接扩大4倍

实验结果表明，与原有的Densenet结构相比，该方法可以节省28.5%的计算成本，对计算精度影响较小。

Transition Layer without Compression：在PeleeNet中，过渡层不会进行通道数量的压缩。
Composite Function：使用"Conv-BN-ReLU"（后激活），而不是想DenseNet那样进行预激活。后激活的好处是，在做inference阶段，可以将所有的BN层与卷积层合并，可以大幅提高计算速度。为了弥补后激活对精度降低的影响，PeleeNet在设计时尽可能“浅而宽”。并且在最后一个dense block之后添加了1*1卷积层以获得更高级的特征。