PyTorch使用细节

2024-07-15 07:50:02
开发
22

model.eval() ：让BatchNorm、Dropout等失效；

with torch.no_grad() ：不再缓存activation，节省显存；

这是矩阵乘法：

y1 = tensor @ tensor.T
y2 = tensor.matmul(tensor.T)

y3 = torch.rand_like(y1)
torch.matmul(tensor, tensor.T, out=y3)

这是点乘：

z1 = tensor * tensor
z2 = tensor.mul(tensor)

z3 = torch.rand_like(tensor)
torch.mul(tensor, tensor, out=z3)

Tensor如果是1*1大小的，可以转为普通Python变量
agg = tensor.sum()
agg_item = agg.item()

Tensor和numpy之间，是share内存的，改一个另一个也被改动
n = torch.ones(5).numpy()

n = np.ones(5)
t = torch.from_numpy(n)

root本地文件夹里有，则从本地读；没有的话，如指定了ownload=True，则从远程下载；
import torch
from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)
Dataset类：通过index，拿到1条数据；

数据可以都在磁盘上，用到哪条，就加载哪条；

自定义一个类，需要继承Dataset类，并重写__init__、__len__、__getitem__

DataLoader类：batching, shuffle(sampling策略), multiprocess加载，pin memory，...

ToTensor(): 把PIL格式的Image，转成Tensor；

Lambda: 把int的y，转成10维度的1-hot向量；

一切模型层，皆继承自torch.nn.Module
class NeuralNetwork(nn.Module):
Module必须copy到device上
model = NeuralNetwork().to(device)
input data也必须copy到device上
X = torch.rand(1, 28, 28, device=device)
不能直接使用Module.forward，使用Module(input)语法可以使前后的hook起作用
logits = model(X)

原文地址:https://blog.csdn.net/smartcat2010/article/details/140424652 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1812635697631334400.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

PyTorch使用细节

2024-07-15 07:50:02 23 阅读
Pytorch简单实现GAN细节及原理

2024-07-15 07:50:02 37 阅读
细节之PyTorch 中的 torch.ones([])

2024-07-15 07:50:02 37 阅读
面向对象-继承-使用细节

2024-07-15 07:50:02 37 阅读
Pytorch实现LetNet5细节及卷积原理

2024-07-15 07:50:02 31 阅读
PyTorch使用

2024-07-15 07:50:02 51 阅读
Mybatis基础教程及使用细节

2024-07-15 07:50:02 35 阅读
pytorch使用文档

2024-07-15 07:50:02 36 阅读
【pytorch】TensorBoard的使用

2024-07-15 07:50:02 28 阅读
pytorch使用基础解惑

2024-07-15 07:50:02 21 阅读

最近更新

题解 - 序列

2024-07-15 07:50:02 85 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-15 07:50:02 71 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-15 07:50:02 66 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-15 07:50:02 70 阅读
NoSQL之Redis非关系型数据库

2024-07-15 07:50:02 73 阅读
2024.7.22 作业

2024-07-15 07:50:02 73 阅读
GDB调试正在运行的程序

2024-07-15 07:50:02 58 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-15 07:50:02 59 阅读
在Django里面运行非项目文件

2024-07-15 07:50:02 57 阅读
SSD基本架构与工作原理

2024-07-15 07:50:02 63 阅读
在誉天学习完HCIE就业吗？

2024-07-15 07:50:02 70 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-15 07:50:02 60 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-15 07:50:02 64 阅读
go 协程池的实现

2024-07-15 07:50:02 63 阅读
Shell脚本循环语句与函数

2024-07-15 07:50:02 64 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-15 07:50:02 69 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-15 07:50:02 61 阅读
四大引用——强软弱虚

2024-07-15 07:50:02 66 阅读
Python语言-面向对象

2024-07-15 07:50:02 68 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-15 07:50:02 62 阅读
网站安全-CDN篇

2024-07-15 07:50:02 63 阅读

热门阅读

Stable Diffusion之最全详解图解

2024-07-15 07:50:02 22 阅读
Spring MVC 中视图的实现原理，在Spring MVC 中实现重定向和转发，以及访问静态资源

2024-07-15 07:50:02 22 阅读
Matplotlib库学习之figure.add_subplot函数

2024-07-15 07:50:02 25 阅读
SpringBoot+Vue实现简单的文件上传（Excel篇）

2024-07-15 07:50:02 20 阅读
uniapp 初始学习1

2024-07-15 07:50:02 30 阅读
在 YAML 中的变量（使用 &和 * 定义及引用变量）

2024-07-15 07:50:02 24 阅读
Vue3+Vite+TS+Axios整合详细教程

2024-07-15 07:50:02 21 阅读
【Playwright+Python】系列 Pytest 插件在Playwright中的使用

2024-07-15 07:50:02 31 阅读
Julia 交互式命令

2024-07-15 07:50:02 24 阅读
基于Python+Django+MySQL+Echarts的租房数据可视化分析系统

2024-07-15 07:50:02 24 阅读
RabbitMQ介绍

2024-07-15 07:50:02 26 阅读
uniapp颜色选择器

2024-07-15 07:50:02 22 阅读
训练营第十一天 | 150. 逆波兰表达式求值

2024-07-15 07:50:02 24 阅读
基于SpringBoot协同过滤算法商品推荐系统(源码+lw+部署文档+讲解等)

2024-07-15 07:50:02 23 阅读
技术成神之路：设计模式（六）策略模式

2024-07-15 07:50:02 20 阅读
什么是DDoS攻击

2024-07-15 07:50:02 25 阅读
How to integrate GPT-4 model hosted on Azure with the gptstudio package

2024-07-15 07:50:02 26 阅读
[NeetCode 150] Word Ladder

2024-07-15 07:50:02 23 阅读
磁环编码器原理

2024-07-15 07:50:02 26 阅读
nginx+lua 实现URL重定向（根据传入的参数条件）

2024-07-15 07:50:02 20 阅读
解决vue多层弹框时存在遮挡问题

2024-07-15 07:50:02 22 阅读
windows10 安装Anaconda

2024-07-15 07:50:02 26 阅读
在word中删除endnote参考文献之间的空行

2024-07-15 07:50:02 22 阅读
Vue2-案例tab切换栏高亮

2024-07-15 07:50:02 25 阅读
项目管理·沟通管理

2024-07-15 07:50:02 26 阅读
CV09_深度学习模块之间的缝合教学(4)--调参

2024-07-15 07:50:02 21 阅读
vuejs v-for和v-if同时使用报变量未定义

2024-07-15 07:50:02 23 阅读
Linux常见配置

2024-07-15 07:50:02 21 阅读
[pytorch]常用函数（自用）

2024-07-15 07:50:02 22 阅读
QuantML-Qlib Model | ICLR 24: 基于独立Patch的时序预测模型

2024-07-15 07:50:02 21 阅读