llama-factory SFT系列教程 (三),chatglm3-6B 命名实体识别实战

背景

简介

利用 llama-factory 框架,基于 chatglm3-6B 模型 做命名实体识别任务;

装包

git clone https://github.com/hiyouga/LLaMA-Factory.git
# conda create -n llama_factory python=3.10
# conda activate llama_factory
cd LLaMA-Factory
pip install -e .[metrics]

主要使用 /LLaMA-Factory/src 下的程序做训练,为了以后导入文件方便;

故笔者在
在这里插入图片描述

数据集

该数据集参考的 DeepKE的数据格式;

DeepKE 的代码不够通用,本文使用 llama-factory 做命名实体识别和通用的数据集格式,更方便读者学习与使用;

数据里已发布在 modelscope 平台上;

数据集示例:

{
	"instruction": "你是专门进行实体抽取的专家。请从input中抽取出符合schema定义的实体,不存在的实体类型返回空列表。请按照JSON字符串的格式回答。 schema: ['address', 'book', 'company', 'game', 'government', 'movie']", 
	"input": "浙商银行企业信贷部叶老桂博士则从另一个角度对五道门槛进行了解读。叶老桂认为,对目前>国内商业银行而言,", 
	"output": "{\"address\": [], \"book\": [], \"company\": [\"浙商银行\"], \"game\": [], \"government\": [], \"movie\": []}"
}

将 命名实体识别任务转换为 序列到序列的生成任务;


llm_ner: 数据集名;
file_name: 文件名;
file_sha1: 利用 sha1sum test.json 计算文件的sha1值;
在这里插入图片描述

lora 微调

CUDA_VISIBLE_DEVICES=0 python ../src/train_bash.py \
--stage sft \
--do_train \
--model_name_or_path ZhipuAI/chatglm3-6b \
--dataset_dir ../data
--dataset llm_ner \
--template chatglm3 \
--finetuning_type lora \
--lora_target query_key_value \
--output_dir w \
--overwrite_cache \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--lr_scheduler_type cosine \
--logging_steps 10 \
--save_strategy epoch \
--learning_rate 5e-5 \
--num_train_epochs 3.0 \
--plot_loss \
--fp16 \

训练过程中损失函数值如下图所示:
在这里插入图片描述

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-04-13 06:06:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-13 06:06:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-13 06:06:06       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-13 06:06:06       20 阅读

热门阅读

  1. 傻瓜式远程P2P联机局域网游戏

    2024-04-13 06:06:06       15 阅读
  2. vue3 reactive

    2024-04-13 06:06:06       19 阅读
  3. 【我的代码生成器】React的FrmUser类源码

    2024-04-13 06:06:06       19 阅读
  4. mac下docker搭建nginx+php+mysql,并实现nginx负载均衡

    2024-04-13 06:06:06       17 阅读
  5. Qt中的事件与事件处理

    2024-04-13 06:06:06       23 阅读
  6. 浅析云算力平台的优势及关键点

    2024-04-13 06:06:06       19 阅读
  7. CSRF

    CSRF

    2024-04-13 06:06:06      52 阅读
  8. WPF —— GDI画板

    2024-04-13 06:06:06       19 阅读
  9. 15. 登录页案例

    2024-04-13 06:06:06       16 阅读