Milvus Cloud 向量数据库Reranker成本比较和使用场景

成本比较:向量检索 v.s. Cross-encoder Reranker v.s. 大模型生成

 

虽然 Reranker 的使用成本远高于单纯使用向量检索的成本,但它仍然比使用 LLM 为同等数量文档生成答案的成本要低。在 RAG 架构中,Reranker 可以筛选向量搜索的初步结果,丢弃掉与查询相关性低的文档,从而有效防止 LLM 处理无关信息,相比于将向量搜索返回的结果全部送进 LLM 可大大减少生成部分的耗时和成本。

5544ee6e26134dc285f76615aa564371.png

 

举一个贴近实际的例子:第一阶段检索中,向量搜索引擎可以在数百万个向量中快速筛选出语义近似度最高的 20 个文档,但这些文档的相对顺序还可以使用 Reranker 进一步优化。虽然会产生一定的成本,但 Reranker 可以在 top-20 个结果进一步挑出最好的 top-5 个结果。那么,相对更加昂贵的 LLM 只需要分析这 top-5 个结果即可,免去了处理 20 个文档带来的更高成本和注意力“涣散”的问题。这样一来,我们就可以通过这种复合方案平衡延迟、回答质量和使用成本。

af016d77de344c7796ee8a3e6e0539ff.png

 

哪种情况适合在 RAG 应用中使用 Reranker?

相关推荐

  1. 向量数据库使用

    2024-04-30 15:20:06       11 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-30 15:20:06       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-30 15:20:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-30 15:20:06       20 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-30 15:20:06       20 阅读

热门阅读

  1. Android APP转成launcher

    2024-04-30 15:20:06       13 阅读
  2. Linux第六章

    2024-04-30 15:20:06       16 阅读
  3. 内存溢出如何实现自动化重启

    2024-04-30 15:20:06       14 阅读
  4. docker

    docker

    2024-04-30 15:20:06      15 阅读
  5. Ubuntu/Linux Anaconda 命令行终端安装

    2024-04-30 15:20:06       18 阅读
  6. bind、call和apply

    2024-04-30 15:20:06       15 阅读
  7. Agent AI智能体的未来

    2024-04-30 15:20:06       17 阅读