在集群中使用deepspeed如果端口被占用可以使用deepspeed参数更改

在集群中使用deepspeed如果端口被占用可以使用deepspeed参数更改

这一次G老师不好使了
在集群中使用deepspeed默认的端口号29500被占用,显示更改居然不起作用
G老师给的方法也不好使
在这里插入图片描述

#!/bin/bash
MASTER_ADDR=localhost
MASTER_PORT=29501  # 选择一个未被占用的端口
export MASTER_ADDR
export MASTER_PORT
deepspeed your_training_script.py --deepspeed_config your_deepspeed_config.json
MASTER_ADDR=localhost MASTER_PORT=29501 deepspeed transformer_train_R2Gen.py

这些命令居然都不好使,还是CSDN上的回答数据稀疏度更好,G老师墨迹来墨迹去都是让我该环境变量,结果通通不好使。最终还是这个命令一招见效。使用就将 29500 改成 29501

deepspeed --master_port 29500 --num_gpus=2 run_s2s.py \
--deepspeed ds_config.json

相关推荐

  1. docker run 使用 -p 命令一直显示端口占用

    2024-04-05 04:32:03       17 阅读
  2. LLaMA 模型和DeepSpeed 框架联系与使用

    2024-04-05 04:32:03       33 阅读
  3. 大模型训练框架DeepSpeed使用入门(1): 训练设置

    2024-04-05 04:32:03       11 阅读
  4. DeepSpeed入门

    2024-04-05 04:32:03       7 阅读
  5. DeepSpeed Autotuning

    2024-04-05 04:32:03       8 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-05 04:32:03       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-05 04:32:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-05 04:32:03       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-05 04:32:03       20 阅读

热门阅读

  1. bash例子-source进程替换、alias不生效处理

    2024-04-05 04:32:03       16 阅读
  2. Bash相关

    2024-04-05 04:32:03       13 阅读
  3. sqlalchemy的Session

    2024-04-05 04:32:03       13 阅读
  4. 中医肝胆笔记

    2024-04-05 04:32:03       18 阅读
  5. uniapp路由传参存在数据类型失真的问题

    2024-04-05 04:32:03       18 阅读
  6. 企业为什么选择高防服务器?

    2024-04-05 04:32:03       15 阅读
  7. postcss安装和使用

    2024-04-05 04:32:03       19 阅读
  8. 蓝桥杯复训之区间dp

    2024-04-05 04:32:03       20 阅读