【RAG 论文】引入 query rewriter 来做查询重写实现对 RAG 的改进

2024-04-30 15:44:01
开发
19

论文：Query Rewriting in Retrieval-Augmented Large Language Models
⭐⭐⭐⭐
EMNLP 2023
Code: github.com/xbmxb/RAG-query-rewriting

文章目录

一、论文速读

如下是一个常见的 RAG pipeline：

RAG pipeline

但这存在一个缺点：input text 和需要 query 的 knowledge 之间不可避免地会存在一个 gap。

本文提出：在将 query 输入给 retriever 之前，增加一个 query rewrite 步骤来弥补这个 gap：

增加 query rewrite

这样，就把之前 RAG 的 retrieve-then-read 改为了 Rewrite-Retrieve-Read 的框架。

同时，根据 rewriter 的技术选型，这里又分成了两种：

将 LLM 作为 query rewriter：由于 LLM 往往是不可训练的（比如 ChatGPT），所以 LLM 可以视作一个 black-box，由它来执行 query rewrite
可训练的 rewrite-retrieve-read：将一个小的 LM 作为 query rewriter，同时根据 reader 的 output 是否 correct 或者 hit 来作为对 rewriter 的反馈，进而对 query rewriter 做强化学习来训练 rewriter

如下图所示：

三种pipeline

二、实验结果

实验结果

可以看到，无论将 frozen LLM 还是 trainable LM 作为 rewriter，都可以改进 RAG 的效果。

论文也给出了使用不同方法时的 prompt：

prompt

三、总结与分析

本文提出了使用 query rewrite 来改进 RAG 的 pipeline 来提高表现，同时给出了一个可训练的 rewriter 的训练思路。

同时，本文的研究还存在以下限制：

在下游任务上，仍然需要一个 generalization 和 specialization 的 trade-off。因为目前额外增加了一个训练过程，让该方法相比于 in-context learning 的 scalability 降低了。
在知识密集型的场景下，使用 web search engine 可能不如经过过滤的 knowledge base 更加专业好用。

原文地址:https://blog.csdn.net/qq_45668004/article/details/138338836 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1785213502949036032.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-04-30 15:44:01 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-30 15:44:01 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-30 15:44:01 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-30 15:44:01 101 阅读
NoSQL之Redis非关系型数据库

2024-04-30 15:44:01 101 阅读
2024.7.22 作业

2024-04-30 15:44:01 98 阅读
GDB调试正在运行的程序

2024-04-30 15:44:01 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-30 15:44:01 85 阅读
在Django里面运行非项目文件

2024-04-30 15:44:01 82 阅读
SSD基本架构与工作原理

2024-04-30 15:44:01 87 阅读
在誉天学习完HCIE就业吗？

2024-04-30 15:44:01 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-30 15:44:01 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-30 15:44:01 86 阅读
go 协程池的实现

2024-04-30 15:44:01 89 阅读
Shell脚本循环语句与函数

2024-04-30 15:44:01 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-30 15:44:01 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-30 15:44:01 85 阅读
四大引用——强软弱虚

2024-04-30 15:44:01 87 阅读
Python语言-面向对象

2024-04-30 15:44:01 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-30 15:44:01 85 阅读
网站安全-CDN篇

2024-04-30 15:44:01 89 阅读