深度学习的深度和宽度的理解[通俗易懂]

深度学习的深度和宽度的理解[通俗易懂]文章目录1.深度1.1为什么加深可以提升性能1.1.1更好拟合特征1.1.2网络更深,每一层要做的事情也更加简单1.2如何定量评估深度与模型性能1.2.1直接法1.2.2间接法1.3加深就一定更好吗?1.3.1加深带来的优化问题1.3.2网络加深带来的饱和2.宽度2.1为什么需要足够的宽度2.2网路到底需要多宽2.2.1网络宽度的下限在哪?2.2.2网络宽度对模型性能的影响2.2.3网络宽度和深度哪个更重要?2.3如何更加有效地利用宽度2.3.1提高每一层的通道的利用率

大家好,又见面了,我是你们的朋友全栈君。

1. 深度

1.1 为什么加深可以提升性能

Bengio和LeCun说过大多说函数如果用一个深层结构刚刚好解决问题,那么就不可能有一个更浅的同样紧凑的结构来解决。 要解决比较复杂的问题, 要么增加深度, 要么增加宽度, 而增加宽度的代价旺旺远高于深度。 一定深度是有必要的.

1.1.1 更好拟合特征

现在的深度学习网络结构基本模块是卷积,池化,激活,这是一个标准的非线性变换模块. 更深的模型, 意味着更好的非线性表达能力, 可以学习更加复杂的变化, 从而可以拟合更加复杂的输入。

1.1.2 网络更深, 每一层要做的事情也更加简单

神经网络的每一层都各司其职, 比如第一层学到了边缘, 第二层学到了简单的形状, 第三层开始学习到了目标的形状, 更深的网络层能学习到更复杂的表达. 如果只有一层, 那么学习到的复杂程度就很小了.

网络加深带来的两个主要的好处, 更强大的表达能力和逐层的特征学习。

1.2 如何定量评估深度与模型性能

理论上一个2层的网络可以拟合任何连续函数, 但是需要宽度很大, 不现实.

我们直到一个模型越深越好, 但是怎么用一个指标直接定量衡量模型的能力和深度之间的关系, 就有了直接和间接法两种方案。

  • 直接法是定义指标理论分析网络的能力;

  • 间接法是通过在任务中的一系列指标比如准确率等来进行比较。

1.2.1 直接法

一个更深的网络, 可以将输入空间分为更多的线性相应空间, 他的能力是浅层网络的指数级倍.

1.2.2 间接法

网络的加深可以提高模型性能, 对比准确度得出: 在一定范围内, 网络越深, 性能越好。

1.3 加深就一定更好吗?

主要从 性能提升和优化 两个方面看:

1.3.1 加深带来的优化问题

ResNet为什么这么成功, 就是因为它是的深层神经网络的训练成为可行.

深层网络带来的 梯度不稳定 , 网络退化的问题始终存在, 可以缓解, 无法消除. 这就是深度加深, 性能反而开始下降的原因.

1.3.2 网络加深带来的饱和

网络的深度不是越深越好。没有一直加深一直提升的情况, 需要实验定论.

2. 宽度

在一定程度上, 网络越深, 性能越好. 这一次我们来考虑另一个维度, 宽度, 即通道的数量.

2.1 为什么需要足够的宽度

深度在一定程度上能够表现出更好的性能, 而宽度则起到另一个作用。那就是让每一层学习到更加丰富的特征, 比如不同方向, 不同频率的纹理特征。 比如颜色的地区, 以及颜色变化的情况等。太窄的网络, 每一层能捕获的模式有限, 此时网络再深都不可能提取到足够的信息往下传递。

2.2 网路到底需要多宽

2.2.1 网络宽度的下限在哪?

考虑到效率, 不能一直增加宽度.因为带来的计算量是平方增长的。宽度不同于深度, 宽度减少后, 用于补偿模型性能的深度不是呈指数级增长, 而是多项式增长, 这似乎反映出宽度并没有深度那么重要。

2.2.2 网络宽度对模型性能的影响

网络的宽度自然不是越宽越好.

2.2.3 网络宽度和深度哪个更重要?

这个问题没有答案, 两者都重要. 因为我们需要细节也需要性能. 不过有些模型对深度更加敏感, 有些对宽度更加敏感。没有谁更重要, 但是建议有限调整网络的宽度。

2.3 如何更加有效地利用宽度

网络宽度非常关键:

  1. 宽度对计算的贡献非常大
  2. 宽度对性能的影响非常大

追求的是越窄性能越高越好, 没有那么好的事儿, 但是可以从这几个方向入手.

2.3.1 提高每一层的通道的利用率

宽度这么重要, 就要好好利用每一个通道, 也就是提高每一个通道的利用率.

2.3.2 用其他通道的信息来补偿

DenseNet网络就是将各层之间进行链接, 在小通道下, 实现高性能.

3. 总结

  • 深度学习的名字带着”深”, 可见深度对模型的重要性.
  • 深度学习成功在于深, 但是宽度也很重要, 甚至不亚于深度, 在计算量上的影响甚至比深度更加重要.
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/143681.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 文件句柄数_系统文件句柄

    文件句柄数_系统文件句柄内核参数fs.file-max指定了系统范围内所有进程可打开的文件句柄的数量限制。合理值计算方法:取决于内存,每1M内存可增加100个。默认情况下,不要将超过10%的内存用于文件。将文件句柄数设置太大的危害是,当大量的文件句柄都为sockets时,会占用大量的内存,这些内存都是不可交换的。要记得的是网络套接字连接符也是文件。对于百万级连接数的进程来说,要设置单个进程可打开的文件句柄数为百万个。比如256G内存,应该配置的值为:256*0.1*1024*100=2621440设置方式:vi/et

    2022年10月17日
  • dos命令进入d盘文件夹(windows cd到d盘)

    如何运行命令提示符,然后使用CD命令进入制定文件夹在win系统下进入命令提示符的方式是在开始的输入框中输入“cmd”,然后按“enter”进入。cd为进入的命令。具体步骤如下:步骤一:在pc端主界面中点击“开始”菜单栏,输入“cmd”,按“enter”进入命令提示符界面。步骤二:使用cd命令进入e盘。如何运行命令提示符,然后使用CD命令进入制定文件夹?使用CD命令进入指定文件?比如在桌面文…

  • MinGW安装过程

    MinGW安装过程一. 下载MinGW官网下载地址:http://sourceforge.net/projects/mingw/二. 安装1. 双击下载好的压缩文件。 2. 然后出现如下界面,点击install(安装)开始安装。 3.指定安装参数选择(安装目录,用户目录选择)后,点击Continue继续下一步。 4.如下界面是下载和设置MinGW的安装配置

  • 【学习笔记】CSS深入理解之absolute「建议收藏」

    【学习笔记】CSS深入理解之absolute「建议收藏」【学习笔记】CSS深入理解之absolute

  • update Google play services_apfs for windows

    update Google play services_apfs for windows原文首发:http://mobileside.cn/post/2010/02/10/GoogleBuzzForWindowsPhone.aspx  昨天晚上,google推出了他们的Buzz产品。什么是Buzz,简单点说,他就是把微博服务和他的地图以及邮件结合到了一起,其实这是一个很典型的LBS。下载地址为:http://www.google.com/gmm/Google

  • 联想计算机的功能键,联想fn键怎么用 联想fn组合按键功能介绍【图文】「建议收藏」

    Fn键是每个笔记本上都拥有的按键,熟悉电脑的朋友都知道,笔记本为了考虑到超薄便携的特性,因此显示器上并没有像台式机那样的控制按钮,因此使用按钮调节笔记本显示器的亮度等参数就没办法实现。为此,笔记本将这些按钮集成到了键盘上,我们根据不同的情况就可以使用这些按钮调节电脑的某些参数。而Fn按键就是协助这些按钮实现操作的重要按键。那么在联想fn键和其他按键结合有什么作用呢?Fn+F1:如果我们在不按下fn…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号