反向传播算法（过程及公式推导）[通俗易懂]

全栈程序员-用户IM • 2022年6月11日下午3:36 • 未分类

反向传播算法（过程及公式推导）[通俗易懂]反向传播算法（Backpropagation）是目前用来训练人工神经网络（ArtificialNeuralNetwork，ANN）的最常用且最有效的算法。

大家好，又见面了，我是你们的朋友全栈君。

反向传播算法（Backpropagation）是目前用来训练人工神经网络（Artificial Neural Network，ANN）的最常用且最有效的算法。其主要思想是：

（1）将训练集数据输入到ANN的输入层，经过隐藏层，最后达到输出层并输出结果，这是ANN的前向传播过程；

（2）由于ANN的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；

（3）在反向传播的过程中，根据误差调整各种参数的值；不断迭代上述过程，直至收敛。

反向传播算法的思想比较容易理解，但具体的公式则要一步步推导，因此本文着重介绍公式的推导过程。

1. 变量定义

反向传播算法（过程及公式推导）[通俗易懂]

上图是一个三层人工神经网络，layer1至layer3分别是输入层、隐藏层和输出层。如图，先定义一些变量：

反向传播算法（过程及公式推导）[通俗易懂]

表示第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层的第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元连接到第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层的第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元的权重；

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层的第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元的偏置；

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层的第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元的输入，即

反向传播算法（过程及公式推导）[通俗易懂]

：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层的第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元的输出，即

反向传播算法（过程及公式推导）[通俗易懂]

：

反向传播算法（过程及公式推导）[通俗易懂]

其中

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示激活函数。

2. 代价函数

代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数（Quadratic cost function）：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

其中，

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示输入的样本，

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示实际的分类，

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示预测的输出，

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示神经网络的最大层数。

3. 公式及其推导

本节将介绍反向传播算法用到的4个公式，并进行推导。如果不想了解公式推导过程，请直接看第4节的算法步骤。

首先，将第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

层第

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

个神经元中产生的错误（即实际值与预测值之间的误差）定义为：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

本文将以一个输入样本为例进行说明，此时代价函数表示为：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

公式1（计算最后一层神经网络产生的错误）：

反向传播算法（过程及公式推导）[通俗易懂]

其中，

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

表示Hadamard乘积，用于矩阵或向量之间点对点的乘法运算。
公式1的推导过程如下：

反向传播算法（过程及公式推导）[通俗易懂]

公式2（由后往前，计算每一层神经网络产生的错误）：

反向传播算法（过程及公式推导）[通俗易懂]

推导过程：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

公式3（计算权重的梯度）：

反向传播算法（过程及公式推导）[通俗易懂]

推导过程：

反向传播算法（过程及公式推导）[通俗易懂]

公式4（计算偏置的梯度）：

反向传播算法（过程及公式推导）[通俗易懂]

推导过程：

反向传播算法（过程及公式推导）[通俗易懂]

4. 反向传播算法伪代码

输入训练集

对于训练集中的每个样本x，设置输入层（Input layer）对应的激活值：
- 前向传播：

反向传播算法（过程及公式推导）[通俗易懂]

，

反向传播算法（过程及公式推导）[通俗易懂]

- 计算输出层产生的错误：

反向传播算法（过程及公式推导）[通俗易懂]

- 反向传播错误：

反向传播算法（过程及公式推导）[通俗易懂]

使用梯度下降（gradient descent），训练参数：

反向传播算法（过程及公式推导）[通俗易懂]

反向传播算法（过程及公式推导）[通俗易懂]

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/131986.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

poe交换机连接方式_路由器接交换机怎么设置

poe交换机连接方式_路由器接交换机怎么设置POE也被称为基于局域网的供电系统或有源以太网，有时也被简称为以太网供电，一个完整的POE系统包括供电端设备和受电端设备两部分。可能会有一些朋友对poe供电有一些疑问，这个在之前也有很多朋友问到过，那么，今天就由飞畅科技的小编来用图文为大家详细介绍下poe的几种供电方式和连接方法，感兴趣的朋友就一起来看看吧！poe交换机的4种连接方式一、交换机和终端都支持PoE这种方法PoE交换机直接通过网线接到支持PoE供电的无线AP和网络摄像机上，这种方…

全栈程序员-用户IM
2022年10月4日
菜鸟教程java_JAVA笔记(菜鸟教程)[通俗易懂]

菜鸟教程java_JAVA笔记(菜鸟教程)[通俗易懂]1.局部变量是在栈上分配的。2.局部变量没有默认值，所以局部变量被声明后，必须经过初始化，才可以使用。3.类变量(静态变量)和实例变量区别在于：类变量是所有对象共有，其中一个对象将它值改变，其他对象得到的就是改变后的结果；而实例变量则属对象私有，某一个对象将其值改变，不影响其他对象。4.访问控制范围访问控制.jpg(1)private类内访问(2)被声明为protected的变量、方法和构造…

全栈程序员-用户IM
2022年6月6日
对角矩阵单位矩阵_矩阵乘单位矩阵等于

对角矩阵单位矩阵_矩阵乘单位矩阵等于importnumpyasnp'''创建矩阵''''''创建矩阵：2维数组'''

全栈程序员-用户IM
2022年8月6日
怎么查看win服务器端口占用,Windows怎么查看端口占用？查看本机端口占用情况…「建议收藏」

怎么查看win服务器端口占用,Windows怎么查看端口占用？查看本机端口占用情况…「建议收藏」什么是端口？假设计算机是一座楼房，端口号就是房号，而端口便是楼层入口。如果需要应用程序和服务器连接的话，必须打开该房门才能连接网络访问服务器。正如站在门口的保安，一些启动应用时刻都在占用端口，我们需要怎么了解某个端口被哪个应用程序占用呢，阅读下文了解查看端口占用情况的方法。操作步骤：1、开始→运行→cmd进入命令提示符→输入netstat-ano即可看到所有连接的PID；2、在任…

全栈程序员-用户IM
2022年7月27日
python数组_js数组添加数据

python数组_js数组添加数据记linuxshell的两个小技巧：shell数组和字符串判断最近在使用shell写脚本的时候，想实现python中两个很简单的功能：1：判断一个字符串是否包含另一个字符串。2：怎么用实现python的列表功能。这里跟大家分享一下。1：判断一个字符串是否包含另一个字符串：123456string=”abcdefg”…文章余二五2017-11-151010浏览量Python数据类型Python…

全栈程序员-用户IM
2022年8月13日
二进制实现加法_递归实现十进制转换二进制

二进制实现加法_递归实现十进制转换二进制一、原理1、化简先看一个例子：看一下3+4的加法运算3的二进制表示：0114的二进制表示：1003^4(3按位异或4)的结果是：111=>7上面的到的结果是

全栈程序员-用户IM
2022年8月3日

发表回复

关注全栈程序员社区公众号