什么是梯度爆炸?
什么是梯度爆炸?
发布时间:2025-05-10 00:31:47
什么是梯度爆炸?
误差梯度是神经网络训练过程中计算的方向和数量,用于以正确的方向和合适的量更新网络 权重。
在深层网络或循环神经网络中,误差梯度可在更新中累积,变成非常大的梯度,然后导致网 络权重的大幅更新,并因此使网络变得不稳定。在极端情况下,权重的值变得非常大,以至 于溢出,导致 NaN 值。
网络层之间的梯度(值大于 1.0)重复相乘导致的指数级增长会产生梯度爆炸。