第十三章：huggingface的resume训练源码内容

2024-06-15 08:32:02
开发
7

文章目录

前言
一、Resume训练源码解读(Trainer->train方法)
二、Resume训练源码解读(_inner_training_loop)
三、self._load_from_checkpoint(resume_from_checkpoint)源码解读
四、self._load_optimizer_and_scheduler源码解读
六、self._load_rng_state(resume_from_checkpoint)源码解读
- 1、self._load_rng_state完整源码
- 2、self._load_rng_state源码解读
总结

前言

大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此，本教程不同文字或理论介绍内容，而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读，助力大模型使用。

本篇文章基于上篇文章Demo解读相关resume源码内容，特别是权重等相关内容加载。

一、Resume训练源码解读(Trainer->train方法)

依然使用trainer.train函数内容，但我这次直解读与resume相关内容，其它在前面文章已有解读。

1、resume_from_checkpoint设定

仍然进入train函数，可知不给参数resume_from_checkpoint是默认为None，或给参数resume_from_checkpoint=False则通过下面转成None。

其代码如下：

def train(
        self,
        resume_from_chec

原文地址:https://blog.csdn.net/weixin_38252409/article/details/139638464 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1801774630827069440.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

第十三章：huggingface的resume训练源码内容

2024-06-15 08:32:02 8 阅读
Hotspot源码解析-第三章

2024-06-15 08:32:02 33 阅读
自然语言处理:第三十三章FILCO：过滤内容的RAG

2024-06-15 08:32:02 4 阅读
Hotspot源码解析-第十七章-虚拟机万物创建（三）

2024-06-15 08:32:02 29 阅读
Hotspot源码解析-第十九章-ClassLoaderData、符号表、字符串表的初始化

2024-06-15 08:32:02 28 阅读
第三章-RocketMQ源码解析-基础模块

2024-06-15 08:32:02 17 阅读
第十三章总结

2024-06-15 08:32:02 33 阅读
第十三章Filter

2024-06-15 08:32:02 37 阅读
第十三章 MySQL

2024-06-15 08:32:02 34 阅读
Linux 第十三章

2024-06-15 08:32:02 12 阅读