Pytorch 叶子节点和非叶子节点的理解

2024-06-06 17:16:04
开发
9

1.为什么要区分叶子节点和非叶子节点？

为了节省内存。在pytorch的计算图里只有两种元素：数据（tensor）和运算（operation）。其中数据可分为：叶子节点（leaf node）和非叶子节点；叶子节点是用户创建的节点，不依赖其它节点；它们表现出来的区别在于反向传播结束之后，非叶子节点的梯度会被释放掉，只保留叶子节点的梯度，这样就节省了内存。

PS：注意这里的描述“非叶子节点的梯度会被释放掉”。这其实暗含了非叶子节点必须是要参与梯度计算的，也就是requires_grad=True，同时也意味着requires_grad=False的节点一定是叶子节点，因为这样的tensor压根不参与求导，也没梯度，自然不需要“释放掉梯度”。这就成为了判别叶子节点和非叶子节点的第一个标准，见下。

2.如何区分叶子节点和非叶子节点？

判断一个节点是否是叶子节点，只需满足以下条件之一：

A.所有requires_grad为False的张量(Tensor) 都为叶子节点( leaf Tensor)

B.requires_grad为True的张量(Tensor)，如果他们是由用户创建的，则它们是叶张量(leaf Tensor)。这意味着它们不是运算的结果,因此grad_fn为None。

>>> a = torch.rand(10, requires_grad=True)
>>> a.is_leaf
True
#a was created by user
>>> b = torch.rand(10, requires_grad=False)
>>> b.is_leaf
True
>>> c = torch.rand(10, requires_grad=True) + 2
>>> c.is_leaf
False
# c was created by the addition operation

PS：神经网络层中的权值w的tensor均为叶子节点

参考：http://t.csdnimg.cn/xbCXP

http://t.csdnimg.cn/NdJ7P

原文地址:https://blog.csdn.net/qq_31239371/article/details/139349323 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1798645017133322240.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

Pytorch 叶子节点和非叶子节点的理解

相关推荐

最近更新

热门阅读