大语言模型的三阶段训练

2023-12-07 09:00:07
开发
31

为了训练专有领域模型，选择LLaMA2-7B作为基座模型，由于LLaMA模型中文词表有限，因此首先进行中文词表的扩展，然后进行三阶段训练（增量预训练，有监督微调，强化学习）。

代码将全部上传到github：

https://github.com/hjandlm/LLM_Train

1. 中文词表扩展

原生词表大小是32K，在词表扩展后，词表大小是63608。

2. 增量预训练

为了防止模型的通用能力减弱或消失，将通用数据和领域数据混合，经过调研决定设置5:1的数据配比进行增量预训练。由于资源有限，显卡是一块A100，40G，因此训练较慢。

目前还处于预训练阶段，情况如下：

训练集损失曲线：

测试集损失曲线：

后续将继续研究如何“炼丹“，敬请期待！

3. 有监督微调

…

4. 强化学习

…

原文地址:https://blog.csdn.net/weixin_48030475/article/details/134496618 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1732565614716915712.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

热门阅读

架构探索之路-第一站-clickhouse | 京东云技术团队

2023-12-07 09:00:07 35 阅读
二百零六、Flume——Flume1.9.0单机版部署脚本（附截图）

2023-12-07 09:00:07 29 阅读
主流开源大语言模型的微调方法

2023-12-07 09:00:07 37 阅读
数据挖掘复盘——apriori

2023-12-07 09:00:07 35 阅读
基于单片机设计的气压与海拔高度检测计(采用MPL3115A2芯片实现)

2023-12-07 09:00:07 28 阅读
数据结构绪论思维导图

2023-12-07 09:00:07 39 阅读
MongoDB归并连续号段-（待验证）

2023-12-07 09:00:07 34 阅读
讲解机器学习中的 K-均值聚类算法及其优缺点。

2023-12-07 09:00:07 35 阅读
深度学习中的各类评价指标

2023-12-07 09:00:07 36 阅读
鸿蒙开发—UI框架概述

2023-12-07 09:00:07 41 阅读
Stable Diffusion Automatic1111 Web UI和dreambooth扩展的安装教程

2023-12-07 09:00:07 39 阅读
OpenFeign远程调用实例

2023-12-07 09:00:07 33 阅读
二.数据结构——数组

2023-12-07 09:00:07 39 阅读
vue3+ts自定义插件

2023-12-07 09:00:07 35 阅读
Nginx实现（缓冲区）

2023-12-07 09:00:07 37 阅读
判断三角形-第11届蓝桥杯选拔赛Python真题精选

2023-12-07 09:00:07 34 阅读
【数据结构】- 详解哈夫曼树（用 C 语言实现哈夫曼树的构造和哈夫曼编码）

2023-12-07 09:00:07 34 阅读
go - 计算CIDR的主机数量

2023-12-07 09:00:07 43 阅读
RefCell 数据类型

2023-12-07 09:00:07 31 阅读
rust高级异步编程二 pin

2023-12-07 09:00:07 32 阅读
Linux下打包Qt-使用linuxDeployQt+appimageTool

2023-12-07 09:00:07 32 阅读
机器学习笔记 - 如何在Python中对网格和点云进行体素化？

2023-12-07 09:00:07 35 阅读
Ubuntu下应用软件安装

2023-12-07 09:00:07 45 阅读
Ubuntu20.24 安装ecCodes，包括 tar.gz 和 python（笔记）

2023-12-07 09:00:07 39 阅读
ubuntu 18.04 pycharm安装

2023-12-07 09:00:07 38 阅读
梯度下降(批量梯度下降、随机梯度下降、小批量梯度下降)

2023-12-07 09:00:07 32 阅读
使用lxml解析本地html文件报错？

2023-12-07 09:00:07 34 阅读
Jupyter Notebook工具

2023-12-07 09:00:07 40 阅读
Docker build 命令

2023-12-07 09:00:07 33 阅读
exynos4412—中断处理

2023-12-07 09:00:07 41 阅读