大语言模型的sft

https://zhuanlan.zhihu.com/p/692892489icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/6928924891.常见的sft的开发流程

a.根据业务场景调整提示词;越详细越好,不要让模型理解歧义,拆分。

b.尝试闭源和开源,以评估LLM能够解决这类场景问题。

c.准备数据,包括多个子任务。

d.训练上线迭代。

2.训练数据要注重什么?

a.确保回答格式和风格的统一。gpt4的回答风格是先复述理解问题,再回答,再总结。经验是训练数据的格式和风格越统一,越能最大限度的发挥模型在具体任务的效果上线。在LIMA,YI,Reformatted alignment中都有提到。

b.训练集既要包含难也要包含易。

相关推荐

  1. 语言模型原理

    2024-06-07 19:16:03       26 阅读
  2. 模型之一:语言模型预训练过程

    2024-06-07 19:16:03       32 阅读
  3. 什么是语言模型Token

    2024-06-07 19:16:03       58 阅读
  4. 语言模型技术-算法原理

    2024-06-07 19:16:03       45 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-07 19:16:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-07 19:16:03       101 阅读
  3. 在Django里面运行非项目文件

    2024-06-07 19:16:03       82 阅读
  4. Python语言-面向对象

    2024-06-07 19:16:03       91 阅读

热门阅读

  1. 基于人工智能的网络空间内容安全治理方法研究

    2024-06-07 19:16:03       32 阅读
  2. adb 常用命令

    2024-06-07 19:16:03       30 阅读
  3. 鸿蒙emitter 订阅事件封装 EmitterUtils

    2024-06-07 19:16:03       33 阅读
  4. git常用命令

    2024-06-07 19:16:03       31 阅读
  5. 自己实现一个Feign

    2024-06-07 19:16:03       27 阅读
  6. Random —— python(And)numpy

    2024-06-07 19:16:03       27 阅读
  7. D365 子窗体调用父窗体方法

    2024-06-07 19:16:03       33 阅读
  8. PyTorch交叉熵理解

    2024-06-07 19:16:03       30 阅读
  9. Python—面向对象小解(4)--模块介绍

    2024-06-07 19:16:03       25 阅读
  10. 【MyBatisPlus】MyBatisPlus介绍与使用

    2024-06-07 19:16:03       30 阅读
  11. 基于python的宠物商店管理系统部署步骤

    2024-06-07 19:16:03       31 阅读
  12. 力扣算法题:多数元素 --多语言实现

    2024-06-07 19:16:03       29 阅读
  13. golang标准库错误处理及自定义错误处理示例

    2024-06-07 19:16:03       32 阅读