深入理解model.eval()与torch.no_grad()

2024-07-10 21:20:09
开发
8

model.eval()

使用model.eval()切换到测试模式，不会更新模型的w（权重），b（偏置）参数
通知dropout层和batchnorm层在train和val中间进行切换：
- 在train模式，dropout层会按照设定的参数p设置保留激活单元的概率（保留概率=p，比如keep_prob=0.8），batchnorm层会继续计算数据的mean和var并进行更新
- 在val模式下，dropout层会让所有的激活单元都通过，而batchnorm层会停止计算和更新mean和var，直接使用在训练阶段已经学出的mean和var值
model.eval()不会影响各层的gradient计算行为，即gradient计算和存储与training模式一样，只是不进行反向传播(backprobagation)

torch.no_grad()

用于停止autograd模块的工作，起到加速和节省显存的作用（具体行为就是停止gradient计算，从而节省了GPU算力和显存）
不会影响dropout和batchnorm层的行为

model.eval()与torch.no_grad()可以同时用，更加节省GPU的算力

在val模式下，为什么让dropout层所有的激活单元都通过，因为train阶段的dropout层已经屏蔽掉了一些激活单元，在val模式下，让所有的激活单元都通过还能预测数据吗?
- 在val模式下，让所有的激活单元都通过当然能预测数据了，相当于学习时限定你每次只能选择一份资料学，考试时开卷所有资料你都带着。val模式下，虽然让所有的激活单元都通过，但是对于各个神经元的输出，要乘上训练时的删除比例后再输出。

原文地址:https://blog.csdn.net/wtl1992/article/details/140331505 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1811027629441159168.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

深入理解服务器进程管理与优化

2024-07-10 21:20:09 45 阅读
深入理解MVCC与BufferPool缓存机制

2024-07-10 21:20:09 42 阅读
npm install：深入理解与应用

2024-07-10 21:20:09 38 阅读
Linux重定向：深入理解与实践

2024-07-10 21:20:09 45 阅读
dubbo：深入理解Apache Dubbo与实战

2024-07-10 21:20:09 36 阅读
深入理解与应用Keepalive机制

2024-07-10 21:20:09 23 阅读
深入理解与应用Keepalive机制

2024-07-10 21:20:09 22 阅读
正则表达式：深入理解与应用

2024-07-10 21:20:09 22 阅读
深入理解 LVS：配置与应用详解

2024-07-10 21:20:09 28 阅读
深入理解与实战CSS变量

2024-07-10 21:20:09 24 阅读

最近更新

题解 - 序列

2024-07-10 21:20:09 5 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-10 21:20:09 5 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-10 21:20:09 5 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-10 21:20:09 5 阅读
NoSQL之Redis非关系型数据库

2024-07-10 21:20:09 6 阅读
2024.7.22 作业

2024-07-10 21:20:09 6 阅读
GDB调试正在运行的程序

2024-07-10 21:20:09 3 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-10 21:20:09 4 阅读
在Django里面运行非项目文件

2024-07-10 21:20:09 4 阅读
SSD基本架构与工作原理

2024-07-10 21:20:09 4 阅读
在誉天学习完HCIE就业吗？

2024-07-10 21:20:09 6 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-10 21:20:09 3 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-10 21:20:09 4 阅读
go 协程池的实现

2024-07-10 21:20:09 4 阅读
Shell脚本循环语句与函数

2024-07-10 21:20:09 4 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-10 21:20:09 5 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-10 21:20:09 5 阅读
四大引用——强软弱虚

2024-07-10 21:20:09 4 阅读
Python语言-面向对象

2024-07-10 21:20:09 7 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-10 21:20:09 6 阅读
网站安全-CDN篇

2024-07-10 21:20:09 5 阅读

热门阅读

Logback日志配置两种方式

2024-07-10 21:20:09 13 阅读
windows用docker-compose.yml拉取镜像报错

2024-07-10 21:20:09 11 阅读
gusture

2024-07-10 21:20:09 8 阅读
Spring Boot集成logback出现log.dir_IS_UNDEFINED问题——未完全解决

2024-07-10 21:20:09 11 阅读
python的抽象基类

2024-07-10 21:20:09 10 阅读
软设之桥接模式

2024-07-10 21:20:09 12 阅读
【案例详解】1. Python实现九九乘法表的24种方法

2024-07-10 21:20:09 9 阅读
07浅谈大语言模型可调节参数tempreture

2024-07-10 21:20:09 11 阅读
深度神经网络语言识别

2024-07-10 21:20:09 11 阅读
【多线程】线程同步--条件变量的原理及其使用

2024-07-10 21:20:09 10 阅读
【第27章】MyBatis-Plus之Mybatis X 插件

2024-07-10 21:20:09 8 阅读
DFT: Parameter-Efficient Fine-Tuning with Discrete Fourier Transform

2024-07-10 21:20:09 9 阅读
4.3 设备管理

2024-07-10 21:20:09 11 阅读
个人博客|PHP源码|支持多国语言切换

2024-07-10 21:20:09 9 阅读
MT3056 交换序列

2024-07-10 21:20:09 10 阅读
ASP.NET Core----基础学习03----开发者异常页面 & MVC工作原理及实现

2024-07-10 21:20:09 10 阅读
html + css 快速实现订单详情的布局demo

2024-07-10 21:20:09 10 阅读
240703_昇思学习打卡-Day15-K近邻算法实现红酒聚类

2024-07-10 21:20:09 10 阅读
教师管理小程序的设计

2024-07-10 21:20:09 5 阅读
04.ffmpeg打印音视频媒体信息

2024-07-10 21:20:09 9 阅读
洛谷 B4006 [GESP202406 四级] 宝箱

2024-07-10 21:20:09 11 阅读
数据结构基础--------【二叉树基础】

2024-07-10 21:20:09 11 阅读
HybridCLR + Addressable 热更新篇（一）

2024-07-10 21:20:09 10 阅读
Qt常用基础控件总结—菜单控件(QMenu类)

2024-07-10 21:20:09 12 阅读
【leetcode52-55图论、56-63回溯】

2024-07-10 21:20:09 9 阅读
OceanBase 配置项&系统变量实现及应用详解（3）：新增配置项的方法

2024-07-10 21:20:09 9 阅读
接口测试基础知识（url,http，接口测试流程）

2024-07-10 21:20:09 10 阅读
缓存击穿、缓存穿透、缓存雪崩以及应对措施

2024-07-10 21:20:09 9 阅读
Python基础学习笔记——异常

2024-07-10 21:20:09 10 阅读
金九银十招聘季, 自动化测试面试题分享

2024-07-10 21:20:09 12 阅读