神经网络与深度学习（一）误差反传BP算法

2024-04-01 06:14:05
开发
37

误差反传BP算法

1多层感知机
- 1.1XOR问题
- 1.2多层感知机
2.BP算法

1多层感知机

1.1XOR问题

线性不可分问题：无法进行线性分类。
Minsky 1969 年提出 XOR 问题
在这里插入图片描述
解决方法：使用多层感知机使用多层感知机

1.2多层感知机

在这里插入图片描述
• 在输入和输出层间加一或多隐单元，构成多层感知器（多层前馈神经网络）
• 加一层隐节点（单元）为三层网络，可解决异或XOR ）问题
由输入得到两个隐节点、一个输出层节点的输出：

可得到：
在这里插入图片描述
设网络有如下一组权值和阈值，可得各节点的输出：

三层感知器可识别任一凸多边形或无界的区域。
更多层感知器网络，可识别为复杂的图形。

2.BP算法

2.1简述

在这里插入图片描述
多层感知机是一种多层前馈网络，由多层神经网络构成，每层网络将输出传递给下一层网络。神经元间的权值连接仅现在相邻之间，不出现在其他位置。如果每一个神经元都连接到上层的所有（除输入层外），则成为全连接网络。

多层前馈网络的反向传播 (BP) 学习算法，简称BP算法，是有导师的学习，它是梯度下降法在多层前馈网中的应用。
网络结构:见上图，u(或x)、y是网络的输入、输出向量，神经元用节点表示，网络由输入层、隐层和输出层节点组成，隐层可一层也可多层 (图中是单隐层) ，前层至后层节点通过权联接。由于用BP学习算法，所以常称BP神经网络。

正向传播是输入信号从输入层经隐层，传向输出层，若输出层得到了期望的输出，则学习算法结束;否则，转至反向传播。
反向传播是将误差(样本输出与网络输出之差) 按原联接通路反向计算，由梯度下降法调整各层节点的权值和闽值，使误差减少

2.2详解

2.2.1输入输出模型

假设网络共有L层，(输入层为第0层，输出为第L层)
层:用上标[l]表示，共L层;
在这里插入图片描述

2.2.2梯度下降算法迭代

在这里插入图片描述
网络训练的目的，是使对每一个输入样本，调整网络权值参数w，使输出均方误差最小化。这是一个最优化问题。

为求解上述最小化问题，考虑迭代算法。
这就是梯度下降算法，也是BP学习算法的基本思想。

2.2.3前向传播在输出端计算误差

考虑二层神经网络(有一层隐含层):
对于第1层第i个神经元，其输出:
在这里插入图片描述
在输出端计算误差

2.2.4误差反传–输出层

在这里插入图片描述

2.2.5误差反传–隐含层

在这里插入图片描述

即误差进行反向传播

2.2.6误差反传–总结

在这里插入图片描述

原文地址:https://blog.csdn.net/weixin_46424753/article/details/137208322 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1774560824250208256.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部