反向传播算法(过程及公式推导)[通俗易懂]

反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(Backpropagation)是目前用来训练人工神经网络(ArtificialNeuralNetwork,ANN)的最常用且最有效的算法。

大家好,又见面了,我是你们的朋友全栈君。

        反向传播算法(Backpropagation)是目前用来训练人工神经网络(Artificial Neural Network,ANN)的最常用且最有效的算法。其主要思想是:
(1)将训练集数据输入到ANN的输入层,经过隐藏层,最后达到输出层并输出结果,这是ANN的前向传播过程;
(2)由于ANN的输出结果与实际结果有误差,则计算估计值与实际值之间的误差,并将该误差从输出层向隐藏层反向传播,直至传播到输入层;
(3)在反向传播的过程中,根据误差调整各种参数的值;不断迭代上述过程,直至收敛。

        反向传播算法的思想比较容易理解,但具体的公式则要一步步推导,因此本文着重介绍公式的推导过程。


1. 变量定义

反向传播算法(过程及公式推导)[通俗易懂]

        上图是一个三层人工神经网络,layer1至layer3分别是输入层、隐藏层和输出层。如图,先定义一些变量:
        反向传播算法(过程及公式推导)[通俗易懂]表示第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层的第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元连接到第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层的第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元的权重;
反向传播算法(过程及公式推导)[通俗易懂]        反向传播算法(过程及公式推导)[通俗易懂]表示第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层的第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元的偏置;
        反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层的第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元的输入,即反向传播算法(过程及公式推导)[通俗易懂]
反向传播算法(过程及公式推导)[通俗易懂]
        反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层的第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元的输出,即反向传播算法(过程及公式推导)[通俗易懂]
反向传播算法(过程及公式推导)[通俗易懂]
        其中反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示激活函数。

2. 代价函数

        代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数(Quadratic cost function):
反向传播算法(过程及公式推导)[通俗易懂]
反向传播算法(过程及公式推导)[通俗易懂]
        其中,反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示输入的样本,反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示实际的分类,反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示预测的输出,反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示神经网络的最大层数。

3. 公式及其推导

        本节将介绍反向传播算法用到的4个公式,并进行推导。如果不想了解公式推导过程,请直接看第4节的算法步骤。
        首先,将第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]层第反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]个神经元中产生的错误(即实际值与预测值之间的误差)定义为:
反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]


        本文将以一个输入样本为例进行说明,此时代价函数表示为:
反向传播算法(过程及公式推导)[通俗易懂]
反向传播算法(过程及公式推导)[通俗易懂]

公式1(计算最后一层神经网络产生的错误):

反向传播算法(过程及公式推导)[通俗易懂]

        其中,反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]表示Hadamard乘积,用于矩阵或向量之间点对点的乘法运算。
公式1的推导过程如下:
反向传播算法(过程及公式推导)[通俗易懂]


公式2(由后往前,计算每一层神经网络产生的错误):

反向传播算法(过程及公式推导)[通俗易懂]

        推导过程:
反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]


公式3(计算权重的梯度):

反向传播算法(过程及公式推导)[通俗易懂]

        推导过程:
反向传播算法(过程及公式推导)[通俗易懂]


公式4(计算偏置的梯度):

反向传播算法(过程及公式推导)[通俗易懂]

        推导过程:
反向传播算法(过程及公式推导)[通俗易懂]


4. 反向传播算法伪代码


  • 输入训练集

  • 对于训练集中的每个样本x,设置输入层(Input layer)对应的激活值反向传播算法(过程及公式推导)[通俗易懂]反向传播算法(过程及公式推导)[通俗易懂]
    • 前向传播:
反向传播算法(过程及公式推导)[通俗易懂], 反向传播算法(过程及公式推导)[通俗易懂]
    • 计算输出层产生的错误:
反向传播算法(过程及公式推导)[通俗易懂]
    • 反向传播错误:反向传播算法(过程及公式推导)[通俗易懂]
反向传播算法(过程及公式推导)[通俗易懂]

  • 使用梯度下降(gradient descent),训练参数:

 反向传播算法(过程及公式推导)[通俗易懂]

反向传播算法(过程及公式推导)[通俗易懂]






版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/131986.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • poe交换机连接方式_路由器接交换机怎么设置

    poe交换机连接方式_路由器接交换机怎么设置POE也被称为基于局域网的供电系统或有源以太网,有时也被简称为以太网供电,一个完整的POE系统包括供电端设备和受电端设备两部分。可能会有一些朋友对poe供电有一些疑问,这个在之前也有很多朋友问到过,那么,今天就由飞畅科技的小编来用图文为大家详细介绍下poe的几种供电方式和连接方法,感兴趣的朋友就一起来看看吧!poe交换机的4种连接方式一、交换机和终端都支持PoE这种方法PoE交换机直接通过网线接到支持PoE供电的无线AP和网络摄像机上,这种方…

  • 菜鸟教程java_JAVA笔记(菜鸟教程)[通俗易懂]

    菜鸟教程java_JAVA笔记(菜鸟教程)[通俗易懂]1.局部变量是在栈上分配的。2.局部变量没有默认值,所以局部变量被声明后,必须经过初始化,才可以使用。3.类变量(静态变量)和实例变量区别在于:类变量是所有对象共有,其中一个对象将它值改变,其他对象得到的就是改变后的结果;而实例变量则属对象私有,某一个对象将其值改变,不影响其他对象。4.访问控制范围访问控制.jpg(1)private类内访问(2)被声明为protected的变量、方法和构造…

  • 对角矩阵单位矩阵_矩阵乘单位矩阵等于

    对角矩阵单位矩阵_矩阵乘单位矩阵等于importnumpyasnp'''创建矩阵''''''创建矩阵:2维数组'''

  • 怎么查看win服务器端口占用,Windows怎么查看端口占用?查看本机端口占用情况…「建议收藏」

    怎么查看win服务器端口占用,Windows怎么查看端口占用?查看本机端口占用情况…「建议收藏」什么是端口?假设计算机是一座楼房,端口号就是房号,而端口便是楼层入口。如果需要应用程序和服务器连接的话,必须打开该房门才能连接网络访问服务器。正如站在门口的保安,一些启动应用时刻都在占用端口,我们需要怎么了解某个端口被哪个应用程序占用呢,阅读下文了解查看端口占用情况的方法。操作步骤:1、开始→运行→cmd进入命令提示符→输入netstat-ano即可看到所有连接的PID;2、在任…

  • python数组_js数组添加数据

    python数组_js数组添加数据记linuxshell的两个小技巧:shell数组和字符串判断最近在使用shell写脚本的时候,想实现python中两个很简单的功能:1:判断一个字符串是否包含另一个字符串。2:怎么用实现python的列表功能。这里跟大家分享一下。1:判断一个字符串是否包含另一个字符串:123456string=”abcdefg”…文章余二五2017-11-151010浏览量Python数据类型Python…

  • 二进制实现加法_递归实现十进制转换二进制

    二进制实现加法_递归实现十进制转换二进制一、原理1、化简先看一个例子:看一下3+4的加法运算3的二进制表示:0114的二进制表示:1003^4(3按位异或4)的结果是:111=>7上面的到的结果是

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号