- 1
- 2
- 3
- 4
- 5
对深度神经网络训练难点的认识
资料介绍
然而在2006年之前,深层多层神经网络似乎并不成功
经过训练,从那时起已经有好几种算法
成功地训练了他们,实验结果显示了
与深度较低的架构相比。所有这些实验结果都是通过新的初始化得到的
或者训练机制。我们的目标是
更好地理解为什么标准梯度下降
随机初始化的结果很糟糕
使用深层神经网络,以便更好地理解
这些最近的相对成功有助于设计
未来会有更好的算法。我们首先观察
非线性激活函数的影响。我们发现logistic乙状结肠激活
不适合于具有随机初始化的深层网络,因为它的平均值可以
尤其是最上面的隐藏层。令人惊讶的是,我们发现饱和单元
可以自己脱离饱和,尽管
慢慢地,有时解释高原
当训练神经网络的时候。我们发现
一种新的不饱和非线性
有益于健康。最后,我们研究如何激活
在训练过程中,梯度在不同的层次上变化,这意味着当雅可比矩阵的奇异值
与每一层相关联的距离远不止1。基于
基于这些考虑,我们提出了一种新的初始化方案,它可以大大加快
汇聚。
1深层神经网络
面向特征层次的深度学习方法
具有更高层次的特征
由低级特征组成。它们包括
出席第十三届国际会议记录
关于人工智能和统计(AISTATS)2010,意大利撒丁岛Chia Laguna度假村。JMLR第9卷:W&CP 9。作者2010年版权所有。
部分文件列表
文件名 | 大小 |
对深度神经网络训练难点的认识.pdf | 2M |
部分页面预览
(完整内容请下载后查看)最新上传
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
cai0603 打赏3.00元 3天前
用户:CJQ_ENJOY
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
cai0603 打赏3.00元 3天前
用户:dongshao
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:gsy幸运
-
21ic下载 打赏310.00元 3天前
用户:zhengdai
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:liqiang9090
-
21ic下载 打赏270.00元 3天前
用户:kk1957135547
-
21ic下载 打赏160.00元 3天前
用户:w178191520
-
21ic下载 打赏160.00元 3天前
用户:w1966891335
-
21ic下载 打赏50.00元 3天前
用户:w993263495
-
21ic下载 打赏40.00元 3天前
用户:w993263495
-
21ic下载 打赏90.00元 3天前
用户:cooldog123pp
-
21ic下载 打赏30.00元 3天前
用户:sun2152
-
21ic下载 打赏40.00元 3天前
用户:xzxbybd
-
21ic下载 打赏40.00元 3天前
用户:铁蛋锅
-
21ic下载 打赏30.00元 3天前
用户:happypcb
-
21ic下载 打赏50.00元 3天前
用户:forgot
-
21ic下载 打赏10.00元 3天前
用户:xuzhen1
-
21ic下载 打赏20.00元 3天前
用户:wanglu6666
-
21ic下载 打赏5.00元 3天前
用户:人间留客
-
21ic下载 打赏5.00元 3天前
用户:jyxjiyixing
-
21ic下载 打赏5.00元 3天前
用户:akae_du
-
21ic下载 打赏5.00元 3天前
用户:ouyang_56
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
xlhtracy 打赏10.00元 3天前
-
xlhtracy 打赏10.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
xlhtracy 打赏5.00元 3天前
-
czmhcy 打赏1.00元 3天前
资料:bitboy
全部评论(1)
2019-12-12 12:16:06suxindg
谢谢分享