使用LLaMA-Factory微调ChatGLM3

1、创建虚拟环境

2、部署LLaMA-Factory

(1)下载LLaMA-Factory

https://github.com/hiyouga/LLaMA-Factory

(2)安装依赖
pip3 install -r requirements.txt

(3)启动LLaMA-Factory的web页面

CUDA_VISIBLE_DEVICES=0 python src/train_web.py

得到如下页面:
在这里插入图片描述

3、ChatGLM3模型微调

设置如下参数,点击开始即可:
在这里插入图片描述
点击“预览命令”,可以看到要执行的python脚本,如下所示:

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \
    --stage sft \
    --do_train \
    --model_name_or_path /root/LLaMA-Factory-main/chatglm3\
    --dataset alpaca_gpt4_zh \
    --template default \
    --finetuning_type lora \
    --lora_target q_proj,v_proj \
    --output_dir path_to_sft_checkpoint \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate 5e-5 \
    --num_train_epochs 3.0 \
    --plot_loss \
    --fp16

web页面和后台都会显示日志信息
在这里插入图片描述

4、推理测试

在这里插入图片描述
输入微调数据中的问题,回答贴合数据集,微调成功。

5、模型合并导出

在这里插入图片描述
待执行完,即可看到/root/LLaMA-Factory-main/merge路径下有了合并的模型了。

6、使用官方项目运行微调合并后的模型

可以看到也是没问题的。
在这里插入图片描述

7、过程中的问题

(1)合并后的模型无法加载,报错信息如下:
AttributeError: property 'eos_token' of 'ChatGLMTokenizer' object has no setter

解决方法:将源模型中除了bin文件和pytorch_model.bin.index.json 以外的文件全部复制到导出目录中覆盖。

(2)模型微调时使用自己的数据集

该项目目前支持两种格式的数据集:alpaca 和 sharegpt,我是用的是 alpaca 格式,数据集按照以下方式组织:

[
  {
   
    "instruction": "用户指令(必填)",
    "input": "用户输入(选填)",
    "output": "模型回答(必填)",
    "system": "系统提示词(选填)",
    "history": [
      ["第一轮指令(选填)", "第一轮回答(选填)"],
      ["第二轮指令(选填)", "第二轮回答(选填)"]
    ]
  }
]

在这里插入图片描述
将数据梳理好之后上传到data目录下。

接下来需要修改data/dataset_info.json,对于上述格式的数据,dataset_info.json 中的 columns 格式应为:

"数据集名称": {
   
  "columns": {
   
    "prompt": "instruction",
    "query": "input",
    "response": "output",
    "system": "system",
    "history": "history"
  }
}

我这里写的是:

"chatglm3": {
   
	"file_name": "chatglm3_train.json",
	"file_sha1": "e655af3db557a4197f7b0cf92e1986b08fae6311",
	"columns": {
   
		"prompt": "instruction",
		"query": "input",
		"response": "output",
		"system": "system",
		"history": "history"
  }
}

相关推荐

  1. 使用 LLaMA Factory 微调 Llama-3 中文对话模型

    2023-12-25 19:52:04       16 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-25 19:52:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-25 19:52:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-25 19:52:04       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-25 19:52:04       20 阅读

热门阅读

  1. 【Qt-QFile-QDir】

    2023-12-25 19:52:04       38 阅读
  2. 不义游戏(二)

    2023-12-25 19:52:04       33 阅读
  3. C++小游戏合集

    2023-12-25 19:52:04       32 阅读
  4. PHP-FPM 的主要作用和功能:

    2023-12-25 19:52:04       41 阅读
  5. c++ 关于共享指针在数组中的所有权转移

    2023-12-25 19:52:04       38 阅读
  6. 数组--[15]三数之和/medium

    2023-12-25 19:52:04       31 阅读
  7. C/C++中double类型的比较

    2023-12-25 19:52:04       43 阅读