Xtuner微调笔记

2024-04-29 11:12:03
开发
10

Xtuner学习视频

两种微调范式

在这里插入图片描述
在指令微调的过程中，需要高质量的对话数据。
而构建高质量的对话（指令）数据，则涉及到以下流程

先通过system/user/assistant的json格式来构造对话模板，把问题和期望模型做出的回答通过这样的格式进行封装
不同的模型有不同的模板来区分system/user/assitant的字段，即一些特殊字符
真正喂给模型的东西是经过chat template包装后的内容

模型只会对【输入的信息里的assitant输出的答案进行loss计算】

微调方案

lora

在这里插入图片描述

Qlora

全参数微调是整个模型加载到内存中，并且所有参数的优化器状态也会加载
lora微调是整个模型参数加载到内存中，但是只加载lora的部分参数的优化器状态
qlora是整个模型的参数都以4bit的形式加载
在这里插入图片描述

原文地址:https://blog.csdn.net/a61022706/article/details/138283209 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1784782669289230336.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部