2.19 图像技术识别与应用

本节课介绍了多层感知机（MLP）及其在图像识别技术中的应用。以下是主要内容总结：

1. 感知机：

- 由Frank Rosenblatt于1957年提出。

- 输入为x，权重为w，偏置为b，输出为二分类（0或1）。

- 可用于实现简单逻辑电路（如与门、与非门、或门）。

- 局限性：只能表示由一条直线分割的空间，无法处理线性不可分问题（如异或门）。

2. 多层感知机（MLP）：

- 通过引入隐藏层和激活函数来解决感知机的局限性。

- 最简单的深度神经网络，能够处理非线性问题。

- 常用激活函数：Sigmoid、Tanh、ReLU。

- 使用Softmax处理多分类问题。

3. 激活函数：

- 作用：决定如何激活输入信号的总和。

- 常见激活函数：阶跃函数、Tanh、ReLU。

- 激活函数需具备连续性、可导性、非线性等性质。

4. 学习过程：

- 前向传播：输入样本经过输入层、隐藏层到输出层。

- 反向传播：误差从输出层反向传播到各层，修正权值。

- 参数更新：通过梯度计算调整网络权值。

5. 训练误差与泛化误差：

- 训练误差：模型在训练数据集上的误差。

- 泛化误差：模型在新数据集上的误差。

- 验证数据集和测试数据集用于评估模型性能。

6. 过拟合与欠拟合：

- 过拟合：模型过于复杂，过度拟合训练数据。

- 欠拟合：模型过于简单，未能捕捉数据的一般性质。

- 模型复杂度受参数个数和参数值范围影响。

7. K折交叉验证：

- 在数据不足时，将训练数据划分为K部分，轮流使用其中一部分作为验证集，其余用于训练。

总结：多层感知机通过引入隐藏层和激活函数，能够处理非线性问题，是深度学习的基础。学习过程包括前向传播和反向传播，模型性能通过训练误差和泛化误差评估，需注意过拟合和欠拟合问题。

希望望本文能帮助你更好地理解多层感知机及其在机器学习中的重要性。如果你对深度学习感兴趣，不妨从多层感知机开始，逐步探索更复杂的神经网络结构。