DeepSpeed Autotuning

AutoTuning

用不同的系统参数试跑用户的模型训练,尝试不同的参数组合,给出每种参数组合的速度,供用户去选择较块的来进行真正的训练。

ZeRO optimization stages;micro-batch sizes;optimizer, scheduler, fp16等;

在DeepSpeed配置文件里,设定:

"autotuning": { "enabled": true }

如果想在batch size上进行枚举,设置:

"train_micro_batch_size_per_gpu": "auto"

fast-mode试跑(大概27分钟跑完),结果:(gas是gradient accumulation steps;tmbspg是train micro-batch-size per GPU)

tuning_space num_experiments best_metric_val best_exp_name
z0 4 59.0229 z0_gas1_tmbspg2
z1 5 87.3017 z1_gas1_tmbspg3
z2 3 77.8338 z2_gas1_tmbspg3
z3 1 0 z3_gas1_tmbspg3
global 13 87.3017 z1_gas1_tmbspg3

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-06-10 14:20:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-10 14:20:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-10 14:20:06       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-10 14:20:06       20 阅读

热门阅读

  1. 10-Eureka-服务注册

    2024-06-10 14:20:06       9 阅读
  2. 在docker容器中使用gdb调试python3.11的进程

    2024-06-10 14:20:06       6 阅读
  3. C语言经典例题-20

    2024-06-10 14:20:06       7 阅读
  4. 天气Api接口

    2024-06-10 14:20:06       9 阅读
  5. 5、Spring之Bean生命周期~创建Bean(1)

    2024-06-10 14:20:06       7 阅读
  6. 关于地址总线

    2024-06-10 14:20:06       12 阅读
  7. 力扣2563.统计公平数对的数目

    2024-06-10 14:20:06       9 阅读
  8. xuexiyixiakeshegebizudejianyi

    2024-06-10 14:20:06       9 阅读
  9. 电脑录屏软件哪个好用视频最清晰

    2024-06-10 14:20:06       7 阅读
  10. Github 2024-06-09 开源项目日报 Top10

    2024-06-10 14:20:06       11 阅读