机器学习第十一次课

2024-06-07 11:28:05
开发
9

前言

从现在开始进入神经网络的领域了

正文

先是一段历史介绍,这个就跳过吧,我觉得这里最重要的就是反向传播这里

反向传播

反向传播（Backpropagation）是一种训练人工神经网络的算法，它通过计算损失函数关于网络参数的梯度来调整网络参数，以减少预测误差。反向传播算法通常与梯度下降法结合使用，以优化网络的权重。

反向传播算法的工作原理可以概括为以下几个步骤：

前向传播：输入样本通过网络，计算每个神经元的输出，直到最后一层。在输出层，计算预测值与实际值之间的误差。
计算误差：使用损失函数（如均方误差、交叉熵等）计算预测值和实际值之间的差异。
反向传播误差：从输出层开始，逆向计算每一层的误差贡献，即计算损失函数对每个权重的梯度。
更新权重：使用梯度下降法或其他优化算法，根据计算出的梯度调整每个权重。

下面是一个简单的反向传播计算例子，考虑一个具有单个输入、单个隐藏层（两个神经元）和单个输出的神经网络。假设激活函数为Sigmoid函数，损失函数为均方误差（MSE）。

网络结构如下：

输入层 -- 隐藏层 -- 输出层

网络参数：

输入到隐藏层的权重：w1, w2
隐藏层到输出层的权重：w3, w4
隐藏层和输出层的偏置：b1, b2

Sigmoid函数定义为：

σ(z) = 1 / (1 + e^(-z))

Sigmoid函数的导数为：

σ'(z) = σ(z) * (1 - σ(z))

计算步骤如下：

前向传播：
- 隐藏层输入：net_h1 = w1 * x + b1, net_h2 = w2 * x + b2
- 隐藏层输出：out_h1 = σ(net_h1), out_h2 = σ(net_h2)
- 输出层输入：net_o = w3 * out_h1 + w4 * out_h2 + b2
- 输出层输出：out_o = σ(net_o)
计算误差：
- 假设实际输出为y，则损失L = 0.5 * (y - out_o)^2
反向传播误差：
- 输出层误差：δ_o = -(y - out_o) * σ'(net_o)
- 隐藏层误差：δ_h1 = w3 * δ_o * σ'(net_h1), δ_h2 = w4 * δ_o * σ'(net_h2)
计算梯度：
- 对于每个权重和偏置，计算损失函数的梯度：
  - dw3 = δ_o * out_h1
  - dw4 = δ_o * out_h2
  - db2 = δ_o
  - dw1 = δ_h1 * x
  - dw2 = δ_h2 * x
  - db1 = δ_h1 + δ_h2
更新权重：
- 使用梯度下降法更新权重和偏置：
  - w1 = w1 - α * dw1
  - w2 = w2 - α * dw2
  - w3 = w3 - α * dw3
  - w4 = w4 - α * dw4
  - b1 = b1 - α * db1
  - b2 = b2 - α * db2

其中α是学习率。

这个过程会重复进行，每次迭代都会使神经网络的预测更接近实际值。这个例子是简化版的反向传播，实际应用中的网络可能包含多个隐藏层，每层有多个神经元，处理起来会更加复杂。

下面还是给一个计算例子吧:

然后这里

我们需要的是x,y,z对于最终f函数的偏导数

但是我们现在只有x,y对于加号,也就是q的倒数,然后我们还有对于q的偏导,当然这里的话z已经可以直接求出偏导了

然后这里用一个链式求导法则就完事了

然后就求出来了!

原文地址:https://blog.csdn.net/m0_73872315/article/details/139425015 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1798919832721297408.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

机器学习第十一次课

前言

正文

反向传播

相关推荐

最近更新

热门阅读