检索增强微调(RAFT)---使语言模型适应特定领域的 RAG

原文地址:retrieval-augmented-fine-tuning-raft

2024 年 3 月 29 日

摘要(Abstract)

  • 论文介绍了一种名为Retrieval Augmented Fine Tuning(RAFT)的训练方法,旨在提升模型在特定领域“开卷”环境下回答问题的能力。
  • RAFT通过训练模型忽略那些对回答问题没有帮助的文档(称为干扰文档),同时引用相关文档中正确的序列来回答问题。
  • 通过RAFT的训练方法,模型能够更好地推理,并在特定领域的RAG任务中提高性能。

引言(Introduction)

  • 大型语言模型(LLMs)在大量公共数据上的训练已经取得了显著进展。
  • 然而,LLMs越来越多地被用于专业领域,如特定软件框架的代码补全或特定文档集合上的问题回答。
  • 适应专业领域的关键是在训练截止后构建的资源上进行训练,这对于许多新兴应用至关重要。

RAFT方法介绍

  • RAFT方法通过结合监督式微调(Supervised Fine-Tuning,简称SFT)和检索增强生成(RAG)来适应预训练LLMs。
  • 训练数据包括问题(Q)、一组文档(Dk)

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-02 07:58:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-02 07:58:05       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-02 07:58:05       82 阅读
  4. Python语言-面向对象

    2024-04-02 07:58:05       91 阅读

热门阅读

  1. MetaGPT部分源码解读--Memory

    2024-04-02 07:58:05       33 阅读
  2. 如何在mysql中生成类似oracle中的rownum行号?

    2024-04-02 07:58:05       32 阅读
  3. Gauss到底是不是国产数据库

    2024-04-02 07:58:05       31 阅读
  4. Windows Server设置NTP服务器

    2024-04-02 07:58:05       39 阅读
  5. 如何反反爬虫

    2024-04-02 07:58:05       33 阅读
  6. Docker环境安装Postgresql数据库Posrgresql 15.6

    2024-04-02 07:58:05       28 阅读
  7. HTTPS工作原理

    2024-04-02 07:58:05       32 阅读
  8. 浅述HTML5的离线存储

    2024-04-02 07:58:05       27 阅读