大语言模型：Query Rewriting for Retrieval-Augmented Large Language Models

2024-03-15 09:48:06
开发
45

总体思路

作者首先指出大语言模型虽然取得了很好的效果，但是仍然存在幻觉和时间顺序混乱的问题，因此需要额外知识库和LLM内部知识库相结合，来修正；
因此优化传统的retriever-reader的方案成为需要；
目前的研究方案当中使用prompt优化的方法是黑盒的不可修改；
因此作者提出了采用大模型重写query的rewrite的方法来优化；
同时作者也提出这种重写的方法可以不是局限于大语言模型的，直接使用可训练的语言模型也能完成相关任务；
在实验当中这种方法对下游任务reader的效果取得了良好的效果。（也就是没有直接评测，而是评测了下游任务）
直接看这个图大致就可以获得作者提出的方案和原始方案的区别了。

在这里插入图片描述

训练细节

作者基础版本的使用LLM的rewriter当中也是使用meta-prompt进行query改写；
作者在训练版本使用了T5作为被训练模型，在开始真正训练之前，因为T5模型本身不能完成这个query获取的任务，因此先使用pseudo数据进行训练，使得其具有这个能力，这些数据就是上一步LLM实现query改写获得的数据；
在训练的过程中主要有几个组成：状态（序列×字母可能性）、动作、概率（实际上的改写策略，默认是上一步预热得到的模型）、reward（使用结果得出的结论）、γ（最终得到的reader输出结果，有无限多种）的强化学习方法

原文地址:https://blog.csdn.net/qq_43210957/article/details/136714469 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1768454089773027328.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

大语言模型--能力

2024-03-15 09:48:06 55 阅读
大语言模型--危害

2024-03-15 09:48:06 59 阅读
大语言模型--数据

2024-03-15 09:48:06 61 阅读
大语言模型--引言

2024-03-15 09:48:06 46 阅读
大语言模型说明书

2024-03-15 09:48:06 46 阅读
大语言模型发展史

2024-03-15 09:48:06 59 阅读
大语言模型

2024-03-15 09:48:06 53 阅读
大语言模型-幻觉

2024-03-15 09:48:06 53 阅读
【AIGC】大语言模型

2024-03-15 09:48:06 46 阅读
人工智能——大语言模型

2024-03-15 09:48:06 26 阅读

最近更新

题解 - 序列

2024-03-15 09:48:06 122 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-03-15 09:48:06 109 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-03-15 09:48:06 98 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-03-15 09:48:06 106 阅读
NoSQL之Redis非关系型数据库

2024-03-15 09:48:06 108 阅读
2024.7.22 作业

2024-03-15 09:48:06 106 阅读
GDB调试正在运行的程序

2024-03-15 09:48:06 87 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-03-15 09:48:06 90 阅读
在Django里面运行非项目文件

2024-03-15 09:48:06 87 阅读
SSD基本架构与工作原理

2024-03-15 09:48:06 95 阅读
在誉天学习完HCIE就业吗？

2024-03-15 09:48:06 98 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-03-15 09:48:06 90 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-03-15 09:48:06 92 阅读
go 协程池的实现

2024-03-15 09:48:06 93 阅读
Shell脚本循环语句与函数

2024-03-15 09:48:06 96 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-03-15 09:48:06 98 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-03-15 09:48:06 90 阅读
四大引用——强软弱虚

2024-03-15 09:48:06 92 阅读
Python语言-面向对象

2024-03-15 09:48:06 96 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-03-15 09:48:06 91 阅读
网站安全-CDN篇

2024-03-15 09:48:06 94 阅读