LLM - 神经网络的训练过程

2024-07-09 20:28:01
开发
20

1. 对于回归问题，用损失函数来计算预测值和真实值的差异，一种常用的公式是如下图所示(Mean Square Error)，如果损失函数的值越小说明神经网络学习越准确，所以神经网络训练目标是减小损失函数的值，

2. 对于分类问题，损失函数和上面不一样，这里使用交叉熵作为损失函数，神经网络训练目标是最小化交叉熵。

3. 最小化损失函数的方法（梯度下降法），即将优化步骤拆分成若干个步骤，每次对损失函数的值做小幅缩小，具体过程是对损失函数求该模型参数的梯度，每次迭代对向着梯度变化最快的方向前进一步（这样就可以计算出模型参数，并在此轮迭代后更新模型参数），这样就可以使损失函数值降低一点，每次前进一步的步长称为学习率。

4. 回归问题的梯度求解过程：输出是标量F(x), 输入是[x1,x2,...xn], 对输入求偏导，得到的向量是梯度。

5. 分类问题的梯度求解过程：输出是向量F(X)，有多个输出，让每个输出对输入变量X[x1,x2,..xn]求微分，得到的jacobian矩阵是梯度

6. 求微分时的链式法则：

7.求微分实例：

8.在实际深度学习场景中，对每个参数梯度计算是通过反向传播算法实现的。

9.单个节点梯度的计算过程: downstream_gradient = upstream_gradient * local_gradient 这个公式在实际写算子时会用到。

原文地址:https://blog.csdn.net/zg260/article/details/140218744 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1810652123285819392.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

LLM - 神经网络的训练过程

2024-07-09 20:28:01 21 阅读
LLM - 神经网络的组成

2024-07-09 20:28:01 17 阅读
pytorch LLM训练过程中的精度调试实践

2024-07-09 20:28:01 19 阅读
神经网络训练中batch的作用

2024-07-09 20:28:01 27 阅读
神经网络设计过程

2024-07-09 20:28:01 23 阅读
PyTorch完整的神经网络模型训练（使用GPU训练）

2024-07-09 20:28:01 38 阅读
通过神经网络模拟人类大脑的学习过程

2024-07-09 20:28:01 49 阅读
BP神经网络详细原理，BP神经网络训练界面详解，基于BP神经网络的公司财务风险分类

2024-07-09 20:28:01 57 阅读
Course2-Week2-神经网络的训练方法

2024-07-09 20:28:01 43 阅读
完美的异步处理数据训练神经网络框架

2024-07-09 20:28:01 49 阅读

最近更新

题解 - 序列

2024-07-09 20:28:01 69 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-09 20:28:01 57 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-09 20:28:01 52 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-09 20:28:01 54 阅读
NoSQL之Redis非关系型数据库

2024-07-09 20:28:01 61 阅读
2024.7.22 作业

2024-07-09 20:28:01 61 阅读
GDB调试正在运行的程序

2024-07-09 20:28:01 46 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-09 20:28:01 49 阅读
在Django里面运行非项目文件

2024-07-09 20:28:01 45 阅读
SSD基本架构与工作原理

2024-07-09 20:28:01 52 阅读
在誉天学习完HCIE就业吗？

2024-07-09 20:28:01 58 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-09 20:28:01 49 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-09 20:28:01 51 阅读
go 协程池的实现

2024-07-09 20:28:01 50 阅读
Shell脚本循环语句与函数

2024-07-09 20:28:01 51 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-09 20:28:01 55 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-09 20:28:01 50 阅读
四大引用——强软弱虚

2024-07-09 20:28:01 54 阅读
Python语言-面向对象

2024-07-09 20:28:01 55 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-09 20:28:01 50 阅读
网站安全-CDN篇

2024-07-09 20:28:01 51 阅读