 

当前位置：马春杰杰  深度学习  正文

[mcj]深度学习中的动量(momentum)是什么？

2019-05-04 分类：深度学习评论(0) 赞(277)

如果把梯度下降法想象成一个小球从山坡到山谷的过程，那么前面几篇文章的小球是这样移动的：从A点开始，计算当前A点的坡度，沿着坡度最大的方向走一段路，停下到B。在B点再看一看周围坡度最大的地方，沿着这个坡度方向走一段路，再停下。确切的来说，这并不像一个球，更像是一个正在下山的盲人，每走一步都要停下来，用拐杖来来探探四周的路，再走一步停下来，周而复始，直到走到山谷。而一个真正的小球要比这聪明多了，从A点滚动到B点的时候，小球带有一定的初速度，在当前初速度下继续加速下降，小球会越滚越快，更快的奔向谷底。momentum 动量法就是模拟这一过程来加速神经网络的优化的。

关于动量法可以参考下面这张大神画的图：

上图直观的解释了动量法的全部内容。

A为起始点，首先计算A点的梯度∇a然后下降到B点，

到了B点需要加上A点的梯度，这里梯度需要有一个衰减值γ ,推荐取0.9。这样的做法可以让早期的梯度对当前梯度的影响越来越小，如果没有衰减值，模型往往会震荡难以收敛，甚至发散。所以B点的参数更新公式是这样的：

其中vt−1表示之前所有步骤所累积的动量和。

这样一步一步下去，带着初速度的小球就会极速的奔向谷底。

摘自：https://blog.csdn.net/tsyccnh/article/details/76270707

赞(277) 打赏

版权声明：本文采用知识共享署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称：《[mcj]深度学习中的动量(momentum)是什么？》
文章链接：https://www.machunjie.com/deeplearning/126.html
本站资源仅供个人学习交流，请于下载后24小时内删除，不允许用于商业用途，否则法律问题自行承担。

分享到

动量深度学习

马春杰杰 

好好学习，天天向上。加油！！！TG群

相关推荐

评论抢沙发

马春杰杰博客始建于2017年6月14日，博客主要分享网站建设中遇到的问题及解决方案、自己在读书过程中的心得体会及分享一些自觉有意义的音视频内容，记录些生活中的琐事，希望博客能督促怠惰的自己不断学习，不断进步。

精彩直达

友情链接视频解析简历生成表白网页联系我们给我留言

4 + 1 = ?

私密评论

:smile:

:sad:

:cool:

:confused:

:cry:

:eek:

:evil:

:exclaim:

:idea:

:lol:

:mad:

:mrgreen:

:neutral:

:question:

:razz:

:redface:

:rolleyes:

:surprised:

:wink:

:biggrin:

:twisted: