在程序中引用cuda.memory函数监控GPU内存

torch.cuda.memory_allocated()torch.cuda.memory_reserved()是用来监控GPU内存使用情况的函数。

torch.cuda.memory_allocated()返回的是当前已经被Tensor分配的GPU内存量,单位是字节。这个值是已经被分配出去,但不一定全部在使用中的内存量。

torch.cuda.memory_reserved()返回的是当前已经被PyTorch保留的GPU内存量,单位也是字节。这个值是已经被PyTorch预留,但可能还没有分配出去的内存量。

在你的输出Before training one epoch: CUDA Memory Allocated: 252406784 Memory Reserved: 1073741824中,CUDA Memory Allocated: 252406784表示在开始训练一个epoch之前,已经有约252MB的GPU内存被Tensor分配了。Memory Reserved: 1073741824表示有约1GB的GPU内存被PyTorch预留了。

这两个值可以帮助你理解你的模型和数据如何使用GPU内存,以及是否有内存泄漏的问题。例如,如果在训练过程中,torch.cuda.memory_allocated()的值持续增长,那么可能存在内存泄漏的问题。

相关推荐

  1. 程序引用cuda.memory函数监控GPU

    2024-07-10 10:44:03       32 阅读
  2. CPU、GPU、硬盘

    2024-07-10 10:44:03       33 阅读
  3. vmstat 监控虚拟,进程,CPU

    2024-07-10 10:44:03       40 阅读
  4. Kubernetes(K8s),CPU和的单位

    2024-07-10 10:44:03       64 阅读
  5. 聊聊App安卓设备所使用的

    2024-07-10 10:44:03       33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 10:44:03       99 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 10:44:03       107 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 10:44:03       90 阅读
  4. Python语言-面向对象

    2024-07-10 10:44:03       98 阅读

热门阅读

  1. LlamaInde相关学习

    2024-07-10 10:44:03       35 阅读
  2. LeetCode每日一题 分发糖果

    2024-07-10 10:44:03       33 阅读
  3. 刷算法Leetcode---9(二叉树篇Ⅲ)

    2024-07-10 10:44:03       31 阅读
  4. 【GC 死亡对象判断】

    2024-07-10 10:44:03       25 阅读
  5. [ABC275A] Find Takahashi 题解

    2024-07-10 10:44:03       24 阅读
  6. 洛谷 P2141 [NOIP2014 普及组] 珠心算测验

    2024-07-10 10:44:03       27 阅读
  7. 微软edge浏览器全解析

    2024-07-10 10:44:03       29 阅读
  8. react根据后端返回数据动态添加路由

    2024-07-10 10:44:03       27 阅读
  9. RedHat运维-Ansible自动化运维基础22-rhel-system-roles

    2024-07-10 10:44:03       22 阅读
  10. 深入浅出:Scikit-Learn基础教程

    2024-07-10 10:44:03       25 阅读
  11. python class

    2024-07-10 10:44:03       25 阅读