RAG 场景对Milvus Cloud向量数据库的需求

虽然向量数据库成为了检索的重要方式,但随着 RAG 应用的深入以及人们对高质量回答的需求,检索引擎依旧面临着诸多挑战。这里以一个最基础的 RAG 构建流程为例:检索器的组成包括了语料的预处理如切分、数据清洗、embedding 入库等,然后是索引的构建和管理,最后是通过 vector search 找到相近的片段提供给 prompt 做增强生成。大多数向量数据库的功能还只落在索引的构建管理和搜索的计算上,进一步则是包含了 embedding 模型的功能。

 

5c5440eb94d140418f2bfdee7f14023f.png

 

 

但在更高级的 RAG 场景中,因为召回的质量将直接影响到生成模型的输出质量和相关性,因此作为检索器底座的向量数据库应该更多的对检索质量负责。为了提升检索质量,这里其实有很多工程化的优化手段,如 chunk_size 的选择,切分是否需要 overlap,如何选择 embedding model,是否需要额外的内容标签,是否加入基于词法的检索来做 hybrid search,重排序 reranker 的选择等等,其中有不少工作是可以纳入向量数据库的考量之中。而检索系统对向量数据库的需求可以抽象描述为:

 

  • 高精度的召回:向量数据库需要能够准确召回与查询语义最相关的文档或信息片段。这要求数据库能够理解和处理高维向量空间中的复杂语义关系,确保召回内容与查询的高度相关性。这里的效果既包括向量检索的数学召回精度也包括嵌入模型的语义精度。

最近更新

  1. TCP协议是安全的吗?

    2024-05-11 17:26:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-11 17:26:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-11 17:26:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-11 17:26:02       20 阅读

热门阅读

  1. Vue 3.x组件生命周期

    2024-05-11 17:26:02       10 阅读
  2. Symfony DomCrawler库在反爬虫应对中的应用

    2024-05-11 17:26:02       10 阅读
  3. GO: 随机数

    2024-05-11 17:26:02       12 阅读
  4. 使用torch.nn.Sequential构建神经网络

    2024-05-11 17:26:02       12 阅读
  5. SpringBoot Mockito 依赖注入

    2024-05-11 17:26:02       10 阅读
  6. vue2中mixins的用法和需要注意的地方

    2024-05-11 17:26:02       10 阅读
  7. linux netstat 查看指定端口

    2024-05-11 17:26:02       9 阅读
  8. 【1分钟了解npm】

    2024-05-11 17:26:02       13 阅读
  9. 不使用EF框架实现数据库增删改查

    2024-05-11 17:26:02       12 阅读