第十三章:huggingface的resume训练源码内容

文章目录


前言

大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此,本教程不同文字或理论介绍内容,而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读,助力大模型使用。

本篇文章基于上篇文章Demo解读相关resume源码内容,特别是权重等相关内容加载。


一、Resume训练源码解读(Trainer->train方法)

依然使用trainer.train函数内容,但我这次直解读与resume相关内容,其它在前面文章已有解读。

1、resume_from_checkpoint设定

仍然进入train函数,可知不给参数resume_from_checkpoint是默认为None,或给参数resume_from_checkpoint=False则通过下面转成None。

其代码如下:

def train(
        self,
        resume_from_chec

相关推荐

  1. huggingfaceresume训练内容

    2024-06-15 08:32:02       8 阅读
  2. -RocketMQ解析-基础模块

    2024-06-15 08:32:02       17 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-15 08:32:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-15 08:32:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-15 08:32:02       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-15 08:32:02       20 阅读

热门阅读

  1. 用python写一个企业知识库算法

    2024-06-15 08:32:02       8 阅读
  2. ADBMS1818驱动程序解析

    2024-06-15 08:32:02       7 阅读
  3. 浏览器无痕模式和非无痕模式的区别

    2024-06-15 08:32:02       6 阅读
  4. MySQL + Keepalived自动切换

    2024-06-15 08:32:02       7 阅读
  5. 2024年考什么证书值钱?着急提升看过来!

    2024-06-15 08:32:02       11 阅读
  6. Mybatis面试系列六

    2024-06-15 08:32:02       6 阅读
  7. C语言——指针

    2024-06-15 08:32:02       7 阅读
  8. 使用 Selenium 自动化获取 CSDN 博客资源列表详解

    2024-06-15 08:32:02       8 阅读
  9. 深入理解 MySQL 查询分析工具 EXPLAIN 的使用

    2024-06-15 08:32:02       7 阅读
  10. Python实现电脑自动关机

    2024-06-15 08:32:02       7 阅读