《向量数据库指南》——Milvus Cloud查询增强如何提升 RAG Pipeline 效果？

2024-07-10 23:02:01
开发
22

查询增强

1.假设性问题

这一方法首先使用LLM为每一条文档块生成一些假设问题，这些文档块可以回答与之对应的假设问题。在RAG阶段，进行一个query-to-query的搜索，先搜索到相关的假设问题，然后找到对应的文档块，再通过它们生成最后的回答。

这里的query-to-query指的是embedding模型的训练方式，训练一个query-to-query模型实际就是训练比较句子的相似性，而不是训练Q-A pair的相似性。所以它是一种对称的“域内（in-domain)”的训练模式，这种方式比不对称的“跨域(out-of-domain)”训练方式会稍微容易且直观一点。

这一方法绕过了在embedding搜索过程中的跨域不对称性，使用query-to-query的直接搜索，减轻了对embedding搜索的要求。但也引入了额外的生成假设问题的开销和不确定性。

额外的开销包括LLM生成假设问题的经济成本，时间成本。不确定性就是和可能的生成的不匹配的问题，或LLM的幻觉导致不懂装懂生成了错误的问题，或系统问题（如LLM网络访问出错）。

2.HyDE

原文地址:https://blog.csdn.net/qinglingye/article/details/140202712 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1811053267044667392.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-07-10 23:02:01 125 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-10 23:02:01 116 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-10 23:02:01 100 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-10 23:02:01 107 阅读
NoSQL之Redis非关系型数据库

2024-07-10 23:02:01 110 阅读
2024.7.22 作业

2024-07-10 23:02:01 108 阅读
GDB调试正在运行的程序

2024-07-10 23:02:01 90 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-10 23:02:01 94 阅读
在Django里面运行非项目文件

2024-07-10 23:02:01 90 阅读
SSD基本架构与工作原理

2024-07-10 23:02:01 98 阅读
在誉天学习完HCIE就业吗？

2024-07-10 23:02:01 102 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-10 23:02:01 95 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-10 23:02:01 97 阅读
go 协程池的实现

2024-07-10 23:02:01 98 阅读
Shell脚本循环语句与函数

2024-07-10 23:02:01 102 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-10 23:02:01 102 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-10 23:02:01 93 阅读
四大引用——强软弱虚

2024-07-10 23:02:01 95 阅读
Python语言-面向对象

2024-07-10 23:02:01 98 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-10 23:02:01 98 阅读
网站安全-CDN篇

2024-07-10 23:02:01 97 阅读

热门阅读

UML 2.5图的分类

2024-07-10 23:02:01 23 阅读
Centos7下zabbix安装与部署

2024-07-10 23:02:01 24 阅读
深入理解Spring Cloud中的服务注册

2024-07-10 23:02:01 32 阅读
SIFT代码，MATLAB

2024-07-10 23:02:01 25 阅读
区块链可投会议CCF C--TrustCom 2024 截止9.1 附去年录用文章

2024-07-10 23:02:01 28 阅读
strcpy,srtcmp,strlen函数漏洞利用

2024-07-10 23:02:01 22 阅读
Scala 数据类型

2024-07-10 23:02:01 29 阅读
【力扣】每日一题—第217题，存在重复元素

2024-07-10 23:02:01 25 阅读
选择排序（C语言版）

2024-07-10 23:02:01 25 阅读
DP学习——简单工厂模式

2024-07-10 23:02:01 25 阅读
从 Spark 离线数仓到 Flink 实时数仓：实战指南

2024-07-10 23:02:01 27 阅读
IntelliJ IDEA社区版在Windows电脑中的下载、安装方法

2024-07-10 23:02:01 29 阅读
浅析DDoS高防数据中心网络

2024-07-10 23:02:01 29 阅读
【深度学习】Transformer

2024-07-10 23:02:01 27 阅读
【LeetCode】生命游戏

2024-07-10 23:02:01 30 阅读
leetcode--从中序与后序遍历序列构造二叉树

2024-07-10 23:02:01 27 阅读
奇幻的Python

2024-07-10 23:02:01 26 阅读
JVM：类的生命周期

2024-07-10 23:02:01 28 阅读
el-date-picker 开始时间选定后，结束时间不可选择开始时间之前的日期

2024-07-10 23:02:01 24 阅读
记录一些简单的linux运维命令

2024-07-10 23:02:01 27 阅读
python--del

2024-07-10 23:02:01 29 阅读
Spring Boot基础篇

2024-07-10 23:02:01 23 阅读
包/final/权限修饰符/代码块

2024-07-10 23:02:01 25 阅读
BiLSTM模型实现

2024-07-10 23:02:01 29 阅读
探索迁移学习：通过实例深入理解机器学习的强大方法

2024-07-10 23:02:01 22 阅读
算力共享，分布式大模型是什么,模型并行，流水线并行

2024-07-10 23:02:01 27 阅读
C++——模板详解（下篇）

2024-07-10 23:02:01 26 阅读
STM32快速复习(八)SPI通信

2024-07-10 23:02:01 20 阅读
【深度学习基础】安装包报错——MAC M3-MAX芯片安装scikit-learn库报错。

2024-07-10 23:02:01 25 阅读
单片机关键任务优先级的实现学习

2024-07-10 23:02:01 25 阅读