为什么要用
batch呢?不光是为了加速。梯度下降是对所有的样本进行求梯度,而随机梯度下降法是对单个样本求梯度,因此梯度下降的单个样本之间是没有关联的,而随机梯度下降的
x(i)是依赖于x(i-1)的,即w(i) = w(i-1) - α(单个样本梯度)因为梯度下降法可以并行计算,因此时间复杂度低,但是它的性能就不高,如果我们用随机梯度下降法,就不能并行计算了,所以时间复杂度高,但是它的性能高,所以我们选择一种折中的方法,这就是
mini-batch,现在说的batch其实就是指的mini-batch!





最新评论
站长您好,亚马逊云咨询推广资源,望建立联系,可邮件,谢谢。
换友情链接吗?
看你的站做的挺不错的
恭喜!!太强了,硕博连读啊
雁过留毛,人过留名。
看不懂但大受震撼
每天都在战争,希望2026和平.
ZeroTier 看过多篇帖子,目前群辉、飞牛os、win11 、安卓、ubuntu ≥18.04 顺利通过,这篇相对于简单 实用、特来感谢 🙄