【深度学习反向传播算法01】什么是反向传播算法？（求解梯度-链式求导法则） - 悦读

【深度学习反向传播算法01】什么是反向传播算法？（求解梯度-链式求导法则）

反向传播算法

本文是根据深度学习课程图文做的笔记

0. 背景

简单深度学习模型的基本流程：

  1. 定义模型
  2. 读入数据
  3. 给出损失函数f
  4. 梯度下降法更新参数（手动求梯度、pytorch自动求导）

对于复杂模型，如100层网络，该怎么解决呢？
⭐反向传播算法

自动求导的本质就是反向传播算法
反向传播算法是一个有效求解梯度的算法，本质是链式求导法则的应用

1. 链式法则

在这里插入图片描述
利用链式求导法则：令 q=x+y

它们的微分：

在这里插入图片描述
又因为 q = x +y

则：
链式法则/反向传播算法的核心：
如果需要对式子中元素求导，可以一层一层的求导然后将结果相乘

2. 反向传播算法

反向传播算法是链式法则的应用
q = x + y f = qz
在这里插入图片描述
绿色：数值红色：求出的梯度
从最后开始的梯度是1 ：从后往前
f 对 q 和z 进行求导

接下来利用链式法则，q对x和y求导

在这里插入图片描述
反向传播算法：每次求导只对当前的运算求导
求解每层网络的参数都是用链式法则将前面的结果输出迭代到这一层，即一个传播的过程

3. Sigmoid函数示例反向传播的过程

在这里插入图片描述
需要求解：

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

阿里云和七牛云对象存储区别和实现

蓝队基础之网络七层杀伤链

SpringBoot整合Mybatis Select等注解报错“Missing method body, or declare abstract”

网络协同新纪元：Eureka引领分布式网络管理革命

RL策略梯度方法之(十七): Stein Variational Policy Gradient (SVPG)

Kubernetes 深入学习（一） —— 入门和集群安装部署

打造高效开发环境：Typescript进阶指南

Day50|leetcode 123.买卖股票的最佳时机III、188.买卖股票的最佳时机IV

ESP32和mDNS学习原创

React Native学习笔记（一）

;