运行pytorch作业出现错误 RuntimeError: unable to write to file

运行pytorch作业出现错误 RuntimeError: unable to write to file · Issue #26 · huaweicloud/dls-example · GitHub

pytorch将共享内存的临时文件保存在了/torch_xxx文件中,即容器中的根目录下。容器磁盘空间不足导致该问题的发生。目前可以通过以下代码暂时关闭pytorch的shared memory功能来规避

直接加在train.py的最前面就可以

import sys
import torch
from torch.utils.data import dataloader
from torch.multiprocessing import reductions
from multiprocessing.reduction import ForkingPickler
 
default_collate_func = dataloader.default_collate
 
 
def default_collate_override(batch):
  dataloader._use_shared_memory = False
  return default_collate_func(batch)
 
setattr(dataloader, 'default_collate', default_collate_override)
 
for t in torch._storage_classes:
  if sys.version_info[0] == 2:
    if t in ForkingPickler.dispatch:
        del ForkingPickler.dispatch[t]
  else:
    if t in ForkingPickler._extra_reducers:
        del ForkingPickler._extra_reducers[t]
 
####以下是train的原始代码

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-08 07:42:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-08 07:42:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-08 07:42:01       87 阅读
  4. Python语言-面向对象

    2024-04-08 07:42:01       96 阅读

热门阅读

  1. 元类创建类的流程详解

    2024-04-08 07:42:01       40 阅读
  2. 【测试开发学习历程】python函数

    2024-04-08 07:42:01       31 阅读
  3. C语言学习分享

    2024-04-08 07:42:01       28 阅读
  4. 什么是物联网?

    2024-04-08 07:42:01       38 阅读
  5. 小程序View点击响应传递多个参数

    2024-04-08 07:42:01       34 阅读
  6. 微信小程序脚本的执行顺序

    2024-04-08 07:42:01       32 阅读
  7. KADB锁冲突查看及解决

    2024-04-08 07:42:01       33 阅读
  8. 金融数据_Scikit-Learn决策树(DecisionTreeClassifier)实例

    2024-04-08 07:42:01       32 阅读