《向量数据库指南》——Milvus Cloud查询增强如何提升 RAG Pipeline 效果?

查询增强

1.假设性问题

这一方法首先使用LLM为每一条文档块生成一些假设问题,这些文档块可以回答与之对应的假设问题。在RAG阶段,进行一个query-to-query的搜索,先搜索到相关的假设问题,然后找到对应的文档块,再通过它们生成最后的回答。

这里的query-to-query指的是embedding模型的训练方式,训练一个query-to-query模型实际就是训练比较句子的相似性,而不是训练Q-A pair的相似性。所以它是一种对称的“域内(in-domain)”的训练模式,这种方式比不对称的“跨域(out-of-domain)”训练方式会稍微容易且直观一点。

这一方法绕过了在embedding搜索过程中的跨域不对称性,使用query-to-query的直接搜索,减轻了对embedding搜索的要求。但也引入了额外的生成假设问题的开销和不确定性。

额外的开销包括LLM生成假设问题的经济成本,时间成本。不确定性就是和可能的生成的不匹配的问题,或LLM的幻觉导致不懂装懂生成了错误的问题,或系统问题(如LLM网络访问出错)。

2.HyDE

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 23:02:01       100 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 23:02:01       107 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 23:02:01       90 阅读
  4. Python语言-面向对象

    2024-07-10 23:02:01       98 阅读

热门阅读

  1. 深入理解Spring Cloud中的服务注册

    2024-07-10 23:02:01       32 阅读
  2. SIFT代码,MATLAB

    2024-07-10 23:02:01       25 阅读
  3. Scala 数据类型

    2024-07-10 23:02:01       29 阅读
  4. DP学习——简单工厂模式

    2024-07-10 23:02:01       25 阅读
  5. 从 Spark 离线数仓到 Flink 实时数仓:实战指南

    2024-07-10 23:02:01       27 阅读
  6. 浅析DDoS高防数据中心网络

    2024-07-10 23:02:01       29 阅读
  7. 奇幻的Python

    2024-07-10 23:02:01       26 阅读
  8. 记录一些简单的linux运维命令

    2024-07-10 23:02:01       27 阅读
  9. python--del

    2024-07-10 23:02:01       29 阅读
  10. BiLSTM模型实现

    2024-07-10 23:02:01       29 阅读