深度学习-李沐-第四节-前向传播、反向传播

2022 年 8 月 16 日 星期二(已编辑)
摘要
前向传播和反向传播是深度学习中神经网络训练的重要过程。前向传播是指神经网络从输入层到输出层的计算过程,而反向传播是计算神经网络参数梯度的方法。在前向传播过程中,数据从输入经过各层神经元的计算传播至输出层,计算网络的预测结果。反向传播利用链式法则按相反顺序遍历网络,计算参数梯度以更新模型参数。前向传播和反向传播相互依赖,通过前向传播计算得到隐藏变量的当前值,以便在反向传播中计算参数的梯度。
这篇文章上次修改于 2024 年 8 月 9 日 星期五,可能部分内容已经不适用,如有疑问可询问作者。

阅读此文章之前,你可能需要首先阅读以下的文章才能更好的理解上下文。

深度学习-李沐-第四节-前向传播、反向传播

前向传播、反向传播

前向传播

前向传播过程,即神经网络从输入层到输出层的计算过程。


前向传播过程
前向传播

前向传播

反向传播

反向传播(backward propagation或backpropagation)指的是计算神经网络参数梯度的方法。
该方法根据微积分中的链式规则,按相反的顺序从输出层到输入层遍历网络。 该算法存储了计算某些参数梯度时所需的任何中间变量(偏导数)
神经网络经过前向传播之后,接下来就可以计算其损失函数。

看不懂反向传播是咋计算的。。。。。。。。

前向传播与反向传播

深层神经网络前向传播过程的基本原理与浅层神经网络前向传播过程的基本原理是一致的。前向传播和反向传播相互依赖。对于前向传播,我们沿着依赖的方向遍历计算图并计算其路径上的所有变量。 然后将这些用于反向传播,其中计算顺序与计算图的相反。 在前向传播期间计算正则项取决于模型参数W1和W2的当前值。 它们是由优化算法根据最近迭代的反向传播给出的。 另一方面,反向传播期间参数的梯度计算, 取决于由前向传播给出的隐藏变量的当前值。

  • Loading...
  • Loading...
  • Loading...
  • Loading...
  • Loading...