Pytorch 叶子节点和非叶子节点的理解

1.为什么要区分叶子节点和非叶子节点?

为了节省内存。在pytorch的计算图里只有两种元素:数据(tensor)和 运算(operation)。其中数据可分为:叶子节点(leaf node)和非叶子节点;叶子节点是用户创建的节点,不依赖其它节点;它们表现出来的区别在于反向传播结束之后,非叶子节点的梯度会被释放掉,只保留叶子节点的梯度,这样就节省了内存。

PS:注意这里的描述“非叶子节点的梯度会被释放掉”。这其实暗含了非叶子节点必须是要参与梯度计算的,也就是requires_grad=True,同时也意味着requires_grad=False的节点一定是叶子节点,因为这样的tensor压根不参与求导,也没梯度,自然不需要“释放掉梯度”。这就成为了判别叶子节点和非叶子节点的第一个标准,见下。

2.如何区分叶子节点和非叶子节点?

判断一个节点是否是叶子节点,只需满足以下条件之一:

A.所有requires_grad为False的张量(Tensor) 都为叶子节点( leaf Tensor)

B.requires_grad为True的张量(Tensor),如果他们是由用户创建的,则它们是叶张量(leaf Tensor)。这意味着它们不是运算的结果,因此grad_fn为None。

>>> a = torch.rand(10, requires_grad=True)
>>> a.is_leaf
True
#a was created by user
>>> b = torch.rand(10, requires_grad=False)
>>> b.is_leaf
True
>>> c = torch.rand(10, requires_grad=True) + 2
>>> c.is_leaf
False
# c was created by the addition operation

PS:神经网络层中的权值w的tensor均为叶子节点

 

参考:http://t.csdnimg.cn/xbCXP 

http://t.csdnimg.cn/NdJ7P 

最近更新

  1. TCP协议是安全的吗?

    2024-06-06 17:16:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-06 17:16:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-06 17:16:04       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-06 17:16:04       20 阅读

热门阅读

  1. 开源VS闭源

    2024-06-06 17:16:04       12 阅读
  2. K8S为什么弃用Docker:容器生态的演进与未来

    2024-06-06 17:16:04       9 阅读
  3. [国家集训队] 聪聪可可 解题记录

    2024-06-06 17:16:04       7 阅读
  4. docker容器内时区相差8小时问题

    2024-06-06 17:16:04       8 阅读
  5. ARM功耗管理架构演进及变迁

    2024-06-06 17:16:04       9 阅读