Bootstrap

【matlab深度学习工具箱】convolution2dLayer参数详解

convolution2dLayer

2-D 卷积层

文章目录

描述

2-D 卷积层将滑动卷积滤波器应用于 2-D 输入。该层通过沿输入方向垂直和水平移动滤波器并计算权重和输入的点积,然后添加偏置项来卷积输入。

创造

语法

layer = convolution2dLayer(filterSize,numFilters)
layer = convolution2dLayer(filterSize,numFilters,Name,Value)

描述

layer = convolution2dLayer(filterSize,numFilters) 创建一个 2-D 卷积层,并设置 FilterSizeNumFilters 属性。

输入参数

名称-值对参数

使用逗号分隔的名称-值对参数指定要沿图层输入边缘添加的填充的大小,或设置 参数和初始化学习速率和正则化以及名称属性。将名称括在单引号中。Stride``DilationFactor``NumChannels

示例:convolution2dLayer(3,16,'Padding','same')创建了一个2-D卷积层,其中包含16个大小为[3 3]的过滤器和“相同”的填充。在训练时,软件计算并设置填充的大小,以便图层输出具有与输入相同的大小。

Padding— 输入边填充 [0 0 0 0] (默认) |非负整数的向量 |“相同”

输入边填充,指定为由以下值之一组成的逗号分隔对:'Padding'

  • 'same'— 添加软件在训练或预测时计算的大小填充,以便在步幅等于 1 时输出与输入具有相同的大小。如果步幅大于 1,则输出大小为 ceil(inputSize/stride),其中 inputSize 是输入的高度或宽度,步幅是相应维度中的步幅。如果可能的话,该软件会在顶部和底部以及左侧和右侧添加相同数量的填充。如果必须垂直添加的填充具有奇数值,则软件会在底部添加额外的填充。如果必须水平添加的填充具有奇数值,则软件会在右侧添加额外的填充。
  • 非负整数 — 将大小填充添加到输入的所有边缘。p``p
  • 非负整数的向量 — 在输入的顶部和底部添加大小填充,向左和向右添加大小填充。[a b]``a``b
  • 非负整数的向量 — 将大小填充添加到输入的顶部、底部、左侧和右侧。[t b l r]``t``b``l``r

**示例:**在输入的顶部和底部添加一行填充,在输入的左侧和右侧添加一列填充。'Padding',1

**示例:**添加填充,使输出与输入具有相同的大小(如果步幅等于 1)。'Padding','same'

性能

卷积

FilterSize— 两个正整数的滤波器 向量的高度和宽度

筛选器的高度和宽度,指定为两个正整数的向量,其中 是高度,是宽度。 定义输入中神经元连接到的局部区域的大小。[h w]``h``w``FilterSize

创建图层时,可以指定为标量以使用相同的高度和宽度值。FilterSize

**示例:**指定高度为 5、宽度为 5 的筛选器。[5 5]

NumFilters— 滤波器 数量正整数

此属性是只读的。

筛选器数,指定为正整数。此数字对应于卷积层中连接到输入中相同区域的神经元数。此参数确定卷积层输出中的通道数(特征映射)。

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|

Stride— 遍历输入 的步长 [1 1](默认)|两个正整数的向量

用于垂直和水平遍历输入的步长,指定为两个正整数的向量,其中是垂直步长,是水平步长。创建图层时,可以指定为标量,以便对两个步长使用相同的值。[a b]``a``b``Stride

**示例:**指定垂直步长 2,水平步长指定 3。[2 3]

DilationFactor— 膨胀卷 积因子 [1 1](默认)|两个正整数的向量

膨胀卷积因子(也称为 atrous convolution),指定为两个正整数的向量,其中是垂直膨胀,是水平膨胀。创建图层时,可以指定为标量,以便对水平和垂直扩张使用相同的值。[h w]``h``w``DilationFactor

使用膨胀卷积来增加层的接受场(层可以看到的输入面积),而不增加参数或计算的数量。

该层通过在每个滤镜元素之间插入零来扩展滤镜。膨胀因子决定了对输入进行采样的步长,或者等效地决定了滤波器的上采样因子。它对应于有效过滤器尺寸(过滤器尺寸 – 1).*膨胀因子+ 1。例如,具有膨胀因子的 3 x 3 滤波器等效于元素之间为零的 5 x 5 滤波器。[2 2]

例:[2 3]

PaddingSize— 填充 大小 [0 0 0 0] (默认值) |四个非负整数的向量

应用于输入边框的填充大小,指定为四个非负整数的向量,其中应用于顶部的填充、应用于底部的填充、应用于左侧的填充以及应用于右侧的填充。`

创建图层时,请使用名称-值对参数指定填充大小。'Padding'

**示例:**在输入的顶部和底部添加一行填充,在输入的左侧和右侧添加两列填充。[1 1 2 2]

PaddingMode— 确定填充大小 “手动”(默认)|的方法“相同”

用于确定填充大小的方法,指定为 或 。'manual'``'same'

软件会根据您在创建图层时指定的值自动设置 的值。PaddingMode``'Padding'

  • 如果将该选项设置为标量或非负整数向量,则 软件会自动设置为 。'Padding'``PaddingMode``'manual'
  • 如果将选项设置为 ,则软件会自动设置为 并计算训练时填充的大小,以便在步幅等于 1 时输出与输入具有相同的大小。如果步幅大于 1,则输出大小为 ceil(inputSize/stride),其中 inputSize 是输入的高度或宽度,步幅是相应维度中的步幅。如果可能的话,该软件会在顶部和底部以及左侧和右侧添加相同数量的填充。如果必须垂直添加的填充具有奇数值,则软件会在底部添加额外的填充。如果必须水平添加的填充具有奇数值,则软件会在右侧添加额外的填充。'Padding'``'same'``PaddingMode``'same'
Padding— 填充 大小 [0 0] (默认值) |两个非负整数的向量

注意

Padding`属性将在将来的版本中删除。请改用。创建图层时,请使用名称-值对参数指定填充大小。`PaddingSize``'Padding'

垂直和水平应用于输入边框的填充大小,指定为两个非负整数的向量,其中填充应用于输入数据的顶部和底部,以及应用于左侧和右侧的填充。[a b]``a``b

**示例:**在输入的顶部和底部添加一行填充,在输入的左侧和右侧添加一列填充。[1 1]

PaddingValue— 值以填充数据 0(默认值)|标量|“对称包含边缘”|“对称排除边缘”|“复制”

要填充数据的值,指定为下列值之一:

PaddingValue描述
标量具有指定标量值的焊盘。 [ 3 1 4 1 5 9 2 6 5 ] → [ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 1 4 0 0 0 0 1 5 9 0 0 0 0 2 6 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ] \begin{bmatrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2&6&5 \end{bmatrix}\rightarrow \begin{bmatrix} 0&0&0 &0&0&0&0\\0&0&0&0&0&0&0\\0&0&3 & 1 & 4&0&0\\0&0& 1 & 5 & 9 &0&0\\0&0&2&6&5&0&0\\0&0&0 &0&0&0&0\\0&0&0&0&0&0&0 \end{bmatrix} 3121564950000000000000000312000015600004950000000000000000
'symmetric-include-edge'使用输入的镜像值(包括边缘值)进行填充。 [ 3 1 4 1 5 9 2 6 5 ] → [ 5 1 1 5 9 9 5 1 3 3 1 4 4 1 1 3 3 1 4 4 1 5 1 1 5 9 9 5 6 2 2 6 5 5 6 6 2 2 6 5 5 6 5 1 1 5 9 9 5 ] \begin{bmatrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2&6&5 \end{bmatrix}\rightarrow \begin{bmatrix} 5&1&1&5&9&9&5\\1&3&3&1&4&4&1\\1&3&3&1&4&4&1\\5&1&1&5&9&9&5\\6&2&2&6&5&5&6\\6&2&2&6&5&5&6\\5&1&1&5&9&9&5\end{bmatrix} 3121564955115665133122113312215115665944955994495595115665
'symmetric-exclude-edge'使用输入的镜像值(不包括边缘值)进行填充。 [ 3 1 4 1 5 9 2 6 5 ] → [ 5 6 2 6 5 6 2 9 5 1 5 9 5 1 4 1 3 1 4 1 3 9 5 1 5 9 5 1 5 6 2 6 5 6 2 9 5 1 5 9 5 1 4 1 3 1 4 1 3 ] \begin{bmatrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2&6&5 \end{bmatrix}\rightarrow \begin{bmatrix} 5&6&2&6&5&6&2\\9&5&1&5&9&5&1\\4&1&3&1&4&1&3\\9&5&1&5&9&5&1\\5&6&2&6&5&6&2\\9&5&1&5&9&5&1\\4&1&3&1&4&1&3 \end{bmatrix} 3121564955949594651565121312136515651594959465156512131213
'replicate'使用输入的重复边框元素进行填充 [ 3 1 4 1 5 9 2 6 5 ] → [ 3 3 3 1 4 4 4 3 3 3 1 4 4 4 3 3 3 1 4 4 4 1 1 1 5 9 9 9 2 2 2 6 5 5 5 2 2 2 6 5 5 5 2 2 2 6 5 5 5 ] \begin{bmatrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2&6&5 \end{bmatrix}\rightarrow \begin{bmatrix} 3&3&3&1&4&4&4\\3&3&3&1&4&4&4\\3&3&3&1&4&4&4\\1&1&1&5&9&9&9\\2&2&2&6&5&5&5\\2&2&2&6&5&5&5\\2&2&2&6&5&5&5 \end{bmatrix} 3121564953331222333122233312221115666444955544495554449555

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|char|string|

NumChannels— 每个过滤器 “自动”(默认)的通道数|正整数

每个滤波器的通道数,指定为或正整数。'auto'

此参数始终等于卷积层输入的通道数。例如,如果输入是彩色图像,则输入的通道数为 3。如果当前层之前的卷积层的滤波器数为 16,则当前层的通道数为 16。

如果是 ,则软件确定训练时的通道数。NumChannels``'auto'

例: 256

参数和初始化

WeightsInitializer— 用于初始化权重 “glorot”(默认)|“他”|“窄正常”|“零”|“一”|函数句柄

用于初始化权重的函数,指定为以下值之一:

  • 'glorot'– 使用 Glorot 初始值设定项 [4](也称为 Xavier 初始值设定项)初始化权重。Glorot 初始值设定项独立地从均值和方差为零的均匀分布中采样,其中 和 。2/(numIn + numOut)``numIn = FilterSize(1)*FilterSize(2)*NumChannels``numOut = FilterSize(1)*FilterSize(2)*NumFilters
  • 'he'– 使用 He 初始值设定项 [5] 初始化权重。He 初始值设定项从均值和方差为零的正态分布中采样,其中 .2/numIn``numIn = FilterSize(1)*FilterSize(2)*NumChannels
  • 'narrow-normal'– 通过从均值为零且标准差为 0.01 的正态分布中独立采样来初始化权重。
  • 'zeros'– 用零初始化权重。
  • 'ones'– 用 1 初始化权重。
  • 函数句柄 – 使用自定义函数初始化权重。如果指定函数句柄,则该函数的格式必须为 ,其中 是权重的大小。有关示例,请参阅指定自定义权重初始化函数weights = func(sz)``sz

仅当属性为空时,该层才会初始化权重。Weights

数据类型: char``string|function_handle

BiasInitializer— 初始化偏差 “零”(默认)|“窄正常”|“一”|函数句柄

用于初始化偏差的函数,指定为以下项之一:

  • 'zeros'– 用零初始化偏差。
  • 'ones'– 用 1 初始化偏差。
  • 'narrow-normal'– 通过从均值为零且标准差为 0.01 的正态分布中独立采样来初始化偏差。
  • 函数句柄 – 使用自定义函数初始化偏差。如果指定函数句柄,则该函数的格式必须为 ,其中 是偏差的大小。bias = func(sz)``sz

仅当属性为空时,该层才会初始化偏差。Bias

数据类型: char``string|function_handle

Weights— 图层权重 [](默认)|数字数组

卷积层的层权重,指定为数字数组。

层权重是可学习的参数。您可以直接使用图层的属性指定权重的初始值。训练网络时,如果图层的属性为非空,则 trainNetwork 会使用该属性作为初始值。如果该属性为空,则使用由图层属性指定的初始值设定项。Weights``Weights``Weights``Weights``trainNetwork``WeightsInitializer

在训练时,是一个 -by-by-by-by- 数组。Weights``FilterSize(1)``FilterSize(2)``NumChannels``NumFilters

数据类型: single|double

Bias— 图层偏差 [](默认)|数字数组

卷积层的层偏差,指定为数字数组。

层偏差是可学习的参数。训练网络时,如果 为 非空,则 trainNetwork 使用该属性作为初始值。如果 为空,则使用 指定的初始值设定项。Bias``Bias``Bias``trainNetwork``BiasInitializer

在训练时,是一个 1 x 1 by 数组。Bias``NumFilters

数据类型: single|double

学习率和正则化

WeightLearnRateFactor— 权重 1 的学习速率因子``(默认)|非负标量

权重的学习速率因子,指定为非负标量。

软件将此因子乘以全局学习速率,以确定该层中权重的学习速率。例如,如果 是 ,则此层中权重的学习速率是当前全局学习速率的两倍。该软件根据您使用 trainingOptions 函数指定的设置来确定全局学习率。WeightLearnRateFactor``2

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|char|string|

BiasLearnRateFactor— 偏差 1 的学习速率因子``(默认值)|非负标量

偏差的学习速率因子,指定为非负标量。

软件将此因子乘以全局学习速率,以确定该层中偏差的学习速率。例如,如果 是 ,则层中偏差的学习速率是当前全局学习速率的两倍。该软件根据您使用 trainingOptions 函数指定的设置来确定全局学习率。BiasLearnRateFactor``2

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|char|string|

WeightL2FactorL2权重的正则化因子 1(默认值)|非负标量

L2权重的正则化因子,指定为非负标量。

该软件将此因子乘以全局L2正则化因子以确定L2此层中权重的正则化。例如,如果 是 ,则WeightL2Factor``2L2此层中权重的正则化是全局的两倍L2正则化因子。您可以指定全局L2使用训练选项函数的正则化因子。

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|char|string|

BiasL2FactorL2偏差的正则化因子 0(默认值)|非负标量

L2偏差的正则化因子,指定为非负标量。

该软件将此因子乘以全局L2正则化因子以确定L2此层中偏差的正则化。例如,如果 是 ,则BiasL2Factor``2L2此层中偏差的正则化是全局的两倍L2正则化因子。您可以指定全局L2使用训练选项函数的正则化因子。

数据类型: | single|double|int8|int16|int32|int64|uint8|uint16|uint32|uint64|char|string|

Name— 图层名称 “”(默认)|字符向量|字符串标量

图层名称,指定为字符向量或字符串标量。对于 Layer 数组输入,trainNetworkassembleNetworklayerGraphdlnetwork 函数会自动为 Name 设置为 '' 的层分配名称

数据类型: char|string

NumInputs— 输入 数 1(默认)

此属性是只读的。

图层的输入数。此层仅接受单个输入。

数据类型:double

InputNames— 输入名称 {'in'} (默认)

此属性是只读的。

输入图层的名称。此层仅接受单个输入。

数据类型:cell

NumOutputs— 输出 数 1(默认)

此属性是只读的。

层的输出数。此层只有一个输出。

数据类型:double

OutputNames— 输出名称 {'out'} (默认值)

此属性是只读的。

图层的输出名称。此层只有一个输出。

数据类型:cell

;