Pytorch实用教程：Pytorch中 ‘tensor‘ 和 ‘tensor.data‘ 的区别是什么

2024-04-11 13:54:02
开发
13

在 PyTorch 中，Tensor 对象是库的核心，用于存储数据和梯度，同时支持自动求导。

当我们讨论 PyTorch Tensor 和它的 .data 属性时，我们涉及到 PyTorch 的早期版本（特别是在 0.4.0 版本之前），那时自动求导机制和 Tensor 的表示方式与现在有所不同。

`Tensor` 变量

在 PyTorch 1.0 及以后的版本中，Tensor 是一个多维数组，它自带了自动求导的功能。这意味着 PyTorch 可以自动跟踪、计算和更新Tensor的梯度，这对于深度学习模型的训练是非常重要的。
你可以通过设置 requires_grad 标志来指定是否需要对某个 Tensor 求导。
```
import torch

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
```
当进行操作（如加、减、乘、除等）产生新的 Tensor 时，PyTorch 会自动构造计算图，这样就可以利用链式法则进行梯度的反向传播。

`Tensor.data`

.data 是一个历史遗留属性，它返回与当前 Tensor 相同数据的 Tensor，但不会被自动求导系统追踪。这意味着，对 .data 的操作不会被记录在计算图中，因此不会影响梯度计算。
在早期的 PyTorch 版本中，.data 被用来访问 Tensor 的原始数据，同时绕过自动求导，但这样做容易导致难以追踪的错误，因为计算图被“短路”了。

当前建议

避免使用 .data：从 PyTorch 0.4.0 开始，强烈建议不要再使用 .data 属性，因为它可能导致计算图的不正确构建，从而影响梯度的计算和模型的训练。如果你需要修改 Tensor 而不影响梯度计算，可以使用 .detach() 方法，这样可以安全地获取不需要梯度的新 Tensor。
```
y = x.detach()
```
.detach() 用法：.detach() 创建了一个新的 Tensor，它与原始 Tensor 共享数据但不需要梯度。这对于实现一些需要操作梯度的 Tensor 但又不希望这些操作被记录（例如，权重更新）的算法非常有用。

应避免使用 .data，因为这可能会导致计算图不正确，而应该使用 .detach() 来获取不追踪梯度的 Tensor 副本，这是一种更安全和更符合当前 PyTorch 设计的做法。

原文地址:https://blog.csdn.net/PoGeN1/article/details/137465018 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1778300451482112000.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

Pytorch实用教程：Pytorch中 ‘tensor‘ 和 ‘tensor.data‘ 的区别是什么

Tensor 变量

Tensor.data

当前建议

相关推荐

最近更新

热门阅读

`Tensor` 变量

`Tensor.data`