大语言模型:Query Rewriting for Retrieval-Augmented Large Language Models

总体思路

  • 作者首先指出大语言模型虽然取得了很好的效果,但是仍然存在幻觉和时间顺序混乱的问题,因此需要额外知识库和LLM内部知识库相结合,来修正;
  • 因此优化传统的retriever-reader的方案成为需要;
  • 目前的研究方案当中使用prompt优化的方法是黑盒的不可修改;
  • 因此作者提出了采用大模型重写query的rewrite的方法来优化;
  • 同时作者也提出这种重写的方法可以不是局限于大语言模型的,直接使用可训练的语言模型也能完成相关任务;
  • 在实验当中这种方法对下游任务reader的效果取得了良好的效果。(也就是没有直接评测,而是评测了下游任务)
    直接看这个图大致就可以获得作者提出的方案和原始方案的区别了。

在这里插入图片描述

训练细节

  • 作者基础版本的使用LLM的rewriter当中也是使用meta-prompt进行query改写;
  • 作者在训练版本使用了T5作为被训练模型,在开始真正训练之前,因为T5模型本身不能完成这个query获取的任务,因此先使用pseudo数据进行训练,使得其具有这个能力,这些数据就是上一步LLM实现query改写获得的数据;
  • 在训练的过程中主要有几个组成:状态(序列×字母可能性)、动作、概率(实际上的改写策略,默认是上一步预热得到的模型)、reward(使用结果得出的结论)、γ(最终得到的reader输出结果,有无限多种)的强化学习方法

相关推荐

  1. 语言模型--能力

    2024-03-15 09:48:06       55 阅读
  2. 语言模型--危害

    2024-03-15 09:48:06       59 阅读
  3. 语言模型--数据

    2024-03-15 09:48:06       61 阅读
  4. 语言模型--引言

    2024-03-15 09:48:06       46 阅读
  5. 语言模型-幻觉

    2024-03-15 09:48:06       53 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-15 09:48:06       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-15 09:48:06       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-15 09:48:06       87 阅读
  4. Python语言-面向对象

    2024-03-15 09:48:06       96 阅读

热门阅读

  1. Spring Boot 事务管理(事务失效常见场景)

    2024-03-15 09:48:06       42 阅读
  2. Python中的区块链技术与应用

    2024-03-15 09:48:06       41 阅读
  3. 每日OJ题_简单多问题dp①_力扣LCR 089. 打家劫舍

    2024-03-15 09:48:06       36 阅读
  4. ChatGPT创造力与创新探究

    2024-03-15 09:48:06       42 阅读
  5. Hive连接函数 concat 和 concat_ws 使用示例

    2024-03-15 09:48:06       36 阅读
  6. 如果保障服务器的安全

    2024-03-15 09:48:06       43 阅读
  7. ubuntu服务器使用netplan管理工具添加静态地址

    2024-03-15 09:48:06       34 阅读
  8. C++ lambda函数个人理解

    2024-03-15 09:48:06       44 阅读
  9. springboot配置文件Tomcat和mvc详细配置

    2024-03-15 09:48:06       37 阅读
  10. 面向对象设计之里氏替换原则

    2024-03-15 09:48:06       41 阅读
  11. SqlServer 系统表

    2024-03-15 09:48:06       44 阅读