LLaMA Factory多卡微调的实战教程(持续更新)

  大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

  本文主要介绍了LLaMA Factory多卡微调的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。需要说明的是,本篇是LLaMA Factory发生重大更新后的迭代版本,所以会持续进行更新。

1. 前言

  在之前博客中介绍了LLaMA Factory单机微调的实战教程,但模型参数量大了以后,必须就要使用多卡进行微调和训练了。尤其最近新出了几个效果很不错的开源大模型,比如Qwen 2-72B-Chat、Qwen1.5-72B-Chat、Command R+(104B),所以即使是A100 80G,也需要多卡进行微调。

  一般来说,是使用deepspeed进行多卡微调的。但是配置环境却并不是那么一帆风顺的。为了帮助同学们加快多卡微调的进度,最终将逐步的操作过程总结如下。希望能对遇到同样需求的同学们有所帮助。

在这里插入图片描述

2. 配置环境

  需要说明的是以下两点:

  1. 本文是在Centos 7+C

相关推荐

  1. LLaMA Factory微调实战教程

    2024-06-13 21:14:02       34 阅读
  2. LLaMA Factory单机微调实战教程

    2024-06-13 21:14:02       41 阅读
  3. 实用执行sql,持续更新

    2024-06-13 21:14:02       60 阅读
  4. 详解大模型微调数据集构建方法(持续更新)

    2024-06-13 21:14:02       31 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-13 21:14:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-13 21:14:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-06-13 21:14:02       82 阅读
  4. Python语言-面向对象

    2024-06-13 21:14:02       91 阅读

热门阅读

  1. 序列化和反序列化

    2024-06-13 21:14:02       34 阅读
  2. 如何提高MySQL DELETE 速度

    2024-06-13 21:14:02       35 阅读
  3. upan量产的知识(来自2011年)

    2024-06-13 21:14:02       32 阅读
  4. ios CCAutoDisappearView.m

    2024-06-13 21:14:02       28 阅读
  5. winhttp劫持dll

    2024-06-13 21:14:02       26 阅读
  6. 赚流量卷,晚点删

    2024-06-13 21:14:02       38 阅读
  7. A.计算圆周率——无穷级数法

    2024-06-13 21:14:02       30 阅读
  8. 【一个 Android 反编译神器jadx】

    2024-06-13 21:14:02       36 阅读
  9. 热门开源项目推荐:技术与地址概览

    2024-06-13 21:14:02       37 阅读
  10. Codeforces Round 952 (Div. 4)(实时更新)

    2024-06-13 21:14:02       34 阅读