RAG增强检索-提升大LLM模型应用的准确率

        检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的 “最新知识” 来增强其能力。

 一、RAG 技术部分

  • Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量

  • 向量数据库:用于存储 Embedding 向量和执行向量相似性检索(检索出最相关的 Top-K 个信息)

  • 提示词工程(Prompt engineering):用于将用户的问题和检索到的上下文组合成大模型的输入

  • 大语言模型(LLM):用于生成回答

 二、提升大模型准确率

        RAG 架构可以有效解决 LLM 产生 “幻觉”、生成内容不可靠的问题,RAG 应用中集成 Reranker,

        Reranker (重排器)是信息检索(IR)生态系统中的一个重要组成部分,用于评估搜索结果,并进行重新排序,从而提升查询结果相关性。在 RAG 应用中,主要在拿到向量查询(ANN)的结果后使用重排器,能够更有效地确定文档和查询之间的语义相关性,更精细地对结果重排,最终提高搜索质量

        重排器在提高检索相关性的同时,也会增加延迟和计算成本。因此,在检索质量、搜索延迟、成本之间进行权衡,重排工具三款:Cohere Rerank 、 BGE Re-Ranker、Jina Reranker

参考:

1、提高 RAG 应用准确度,时下流行的 Reranker 了解一下  

 提高 RAG 应用准确度,时下流行的 Reranker 了解一下?-腾讯云开发者社区-腾讯云

2、Cohere AI 推出 Rerank 3:旨在优化企业搜索和 RAG(检索增强生成)系统的先进模型

https://medium.com/@bitrise.co.in/cohere-ai-unveils-rerank-3-a-state-of-the-art-model-designed-to-optimize-enterprise-search-and-rag-fe32a2da5533

3、RAG 再添新利器!智源开源最强检索排序模型 BGE Re-Ranker v2.0

RAG 再添新利器!智源开源最强检索排序模型 BGE Re-Ranker v2.0

https://my.oschina.net/u/3859945/blog/11455333

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 10:02:04       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 10:02:04       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 10:02:04       58 阅读
  4. Python语言-面向对象

    2024-07-14 10:02:04       69 阅读

热门阅读

  1. C#学习

    2024-07-14 10:02:04       27 阅读
  2. 华为生成树协议技术概述

    2024-07-14 10:02:04       26 阅读
  3. 如何使用Gunicorn配置SSL/TLS加密Web服务

    2024-07-14 10:02:04       35 阅读
  4. 八部金刚功-1.0.5-july 14th

    2024-07-14 10:02:04       24 阅读
  5. R 绘图 - 中文支持

    2024-07-14 10:02:04       22 阅读
  6. 不遵守全局主键配置【PGSQL】

    2024-07-14 10:02:04       19 阅读
  7. 手撕排序算法:冒泡排序

    2024-07-14 10:02:04       25 阅读
  8. 深入探究:Spring 中的消息队列实现方式

    2024-07-14 10:02:04       22 阅读
  9. 中介子方程五十八

    2024-07-14 10:02:04       15 阅读
  10. 【Perl】Perl 语言入门

    2024-07-14 10:02:04       19 阅读
  11. 2024-07-13 Qt6.5版本后视频渲染

    2024-07-14 10:02:04       25 阅读
  12. 格式化输出游戏装备的名称和单价

    2024-07-14 10:02:04       17 阅读
  13. OTP防重放攻击

    2024-07-14 10:02:04       20 阅读
  14. 排序之冒泡排序

    2024-07-14 10:02:04       22 阅读
  15. flutter弹窗高度过高,在弹出键盘后布局溢出问题

    2024-07-14 10:02:04       22 阅读