YoloV5

Author:张一极

主体结构:

image-20210730204755556

0.Focus:聚合w,h维度信息到通道空间,每个点的提高感受野

image-20210730203525705

解释:输入为batch * channel * w * h的矩阵,经过四个切片以后,第一个切片[..., ::2, ::2]代表每个通道隔一个取一个值,第二个切片x[..., 1::2, ::2]表示从第一个位置开始隔一个取一个值,与第一个切片正好错开,第三第四哥切片正好是从高度切片:x[..., ::2, 1::2], x[..., 1::2, 1::2]]

1.Bottleneck:残差连接提升模型的特征抽取能力和网络层数

image-20210730204004177

Bottleneck:输入为input,接入1x1卷积后接3x3卷积,3x3卷积输出与输入相加后得到Bottleneck的输出。

2.BottleneckCSP:残差连接提升模型的特征抽取能力和网络层数

BottleneckCSP:

image-20210730204907327

3.SPP:空间金字塔池化:集成不同感受野的池化特征

image-20210730204258719

SPP:

经过一个1x1卷积扩充维度后,三个池化分支,最后通道层面进行拼接输出经过一个1x1卷积。

4.最后的三个conv得到三个输出,这部分值得好好详述(留坑)

20210730