XTuner大模型单卡低成本微调实战笔记和作业

2024-02-21 14:52:02
开发
57

书生·浦语大模型实战营笔记系列`

4）XTuner大模型单卡低成本微调实战笔记和作业

文章目录

书生·浦语大模型实战营笔记系列`
4）XTuner大模型单卡低成本微调实战笔记和作业
前言
一、Finetune
二、Xtuner
三、8GB玩转LLM
四、动手实战部分
五、课后作业
总结

前言

承接第三节课这节课来展开讲讲Finetune以及xtuner这个框架
在这里插入图片描述

一、Finetune

包括增量预训练微调和指令跟随微调
在这里插入图片描述

1.指令跟随微调

在这里插入图片描述

2.增量预训练微调

在这里插入图片描述

3.LoRA和QLoRA

xtuner中使用的微调原理是LoRA和QLoRA
在这里插入图片描述
全参数微调 vs LoRA微调 vs QLoRA微调

二、Xtuner

在这里插入图片描述

三、8GB玩转LLM

xtuner默认启动了flash attention

在这里插入图片描述

四、动手实战部分

这部分继续放上源文档
 源视频
作业是一个更好的动手操作验证的例子
如果只做课后作业来实践的话，感觉这里可以着重看看那配置文件的常用超参部分，区分一下用基础模型的chat和基础模型加Adapter的chat以及merge后的chat，最后就是课程里补充的Ms-Agent 数据集赋予的LLM以Agent能力，可以学一下怎么训练到模型学会调用Agent。

五、课后作业

在这里插入图片描述
训练的时候可以改下batch也可以加快哦，我好像改到8了
若要开启 deepspeed 加速，增加 --deepspeed deepspeed_zero2 即可

作业参考源文档
 作业源视频
跟着这个微调的效果有点差强人意（过拟合了哈哈，如果不想过拟合训练的时候可以加点别的内容
以下是我的作业截图
在这里插入图片描述

总结

学习了一下对大模型的微调，估计还是要对数据集进行实操一下才能更深刻的理解，不过看看吧（希望不懒哈哈

原文地址:https://blog.csdn.net/weixin_45720528/article/details/136177222 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1760195654967234560.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-02-21 14:52:02 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-02-21 14:52:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-02-21 14:52:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-02-21 14:52:02 100 阅读
NoSQL之Redis非关系型数据库

2024-02-21 14:52:02 101 阅读
2024.7.22 作业

2024-02-21 14:52:02 96 阅读
GDB调试正在运行的程序

2024-02-21 14:52:02 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-02-21 14:52:02 85 阅读
在Django里面运行非项目文件

2024-02-21 14:52:02 82 阅读
SSD基本架构与工作原理

2024-02-21 14:52:02 87 阅读
在誉天学习完HCIE就业吗？

2024-02-21 14:52:02 93 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-02-21 14:52:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-02-21 14:52:02 85 阅读
go 协程池的实现

2024-02-21 14:52:02 88 阅读
Shell脚本循环语句与函数

2024-02-21 14:52:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-02-21 14:52:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-02-21 14:52:02 85 阅读
四大引用——强软弱虚

2024-02-21 14:52:02 86 阅读
Python语言-面向对象

2024-02-21 14:52:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-02-21 14:52:02 85 阅读
网站安全-CDN篇

2024-02-21 14:52:02 88 阅读

热门阅读

c语言之for循环语句

2024-02-21 14:52:02 44 阅读
我的创作纪念日

2024-02-21 14:52:02 58 阅读
ARM处理器有哪些工作模式和寄存器？各寄存器作用是什么？ARM异常中断处理流程？

2024-02-21 14:52:02 59 阅读
说一下JVM类加载机制？

2024-02-21 14:52:02 49 阅读
打码半年，开源一款自定义大屏设计软件！

2024-02-21 14:52:02 64 阅读
VS和QT联合开发

2024-02-21 14:52:02 55 阅读
个人建站前端篇（五）插件unplugin-vue-components的使用

2024-02-21 14:52:02 51 阅读
Kubernetes（K8s）的基础概念

2024-02-21 14:52:02 40 阅读
vue父组件调用子组件的方法或传递值给子组件

2024-02-21 14:52:02 55 阅读
vue中404解决方法

2024-02-21 14:52:02 43 阅读
K8S故障处理指南：网络问题排查思路

2024-02-21 14:52:02 32 阅读
动态获取微信小程序appid / 自定义启动命令

2024-02-21 14:52:02 34 阅读
（十一）【Jmeter】线程（Threads(Users)）之jp@gc-Ultimate Thread Group

2024-02-21 14:52:02 40 阅读
黑客（网络安全）技术速成自学

2024-02-21 14:52:02 40 阅读
初识aurora

2024-02-21 14:52:02 43 阅读
Python从进阶到高级—通俗易懂版

2024-02-21 14:52:02 42 阅读
【LeetCode: 106. 从中序与后序遍历序列构造二叉树 + DFS】

2024-02-21 14:52:02 58 阅读
Spring: MultipartFile和File的区别

2024-02-21 14:52:02 47 阅读
Redis篇----第十一篇

2024-02-21 14:52:02 49 阅读
布客深度学习译文集 2024.2 更新

2024-02-21 14:52:02 55 阅读
Spring IoC容器详解

2024-02-21 14:52:02 45 阅读
A*的python实现加讲解

2024-02-21 14:52:02 54 阅读
Python中的Lambda函数

2024-02-21 14:52:02 49 阅读
一个网址包含有什么？ URL-简介

2024-02-21 14:52:02 53 阅读
软件价值14-碰撞弹球

2024-02-21 14:52:02 52 阅读
492. Construct the Rectangle（构造矩形）

2024-02-21 14:52:02 48 阅读
C语言：幂的末尾

2024-02-21 14:52:02 45 阅读
stm32 DMA

2024-02-21 14:52:02 45 阅读
D4558—— 具有两个独立的、高增益、内部相位补偿的双运算放大器。可适用于单电源或双电源工作。主要应用于音频信号放大，有源滤波器等场合。

2024-02-21 14:52:02 40 阅读
pip镜像源：清华镜像、阿里云镜像、豆瓣镜像与如何修改默认镜像源

2024-02-21 14:52:02 58 阅读