可视化分析大模型系统RAG数据处理流程

2024-07-19 11:44:03
开发
18

RAG

写在前面

欢迎大家关注我最近开发项目：LangChat是Java生态下企业级AIGC项目解决方案，在RBAC权限体系的基础上，集成AIGC大模型功能，帮助企业快速定制AI知识库、企业AI机器人。

开源地址：https://github.com/TyCoding/langchat

产品官网：http://langchat.cn/

Baptiste Adrien分享了使用 Vercel和NextJS 开发 RAG（检索增强生成）系统，使用图例详细介绍RAG系统的设计流程，非常直观详细，对于学习大模型AIGC产品设计流程非常有帮助。

1. 文档处理

开发RAG系统的第一步是准备文档，这些文档将作为RAG系统的基础输入数据。

2. OCR文本提取

接下来，文档由 OCR（图片转文本）模型进行处理。如果需要，该模型会提取文本。

3. 文本拆分

文本被分成更小的、易于管理的部分。这种分块可以在后期进行更有效的处理和分析。

4. 文本嵌入

然后每个文本块都会通过嵌入模型。该模型将块转换为向量，即捕获文本语义的数字表示。

5. 向量存储

上一步将文本转换为向量数据库需要存储到向量数据库中（例如PgVector），该数据库允许系统根据语义相似性有效地检索相关信息。

6. 输入问题并检索

用户向系统输入问题，该问题将用于从矢量数据库中检索最相关的信息（其实就是从向量库中匹配相似的数据）。

7. 输入嵌入

接下来需要将用户输入的问题转换成相同的向量纬度，只有转换成和文档相同的向量纬度，确保了问题和文本块都位于同一向量空间中，才能从向量数据库中匹配到相似的数据

8. 向量匹配

同上，将嵌入后的问题在向量存储库中检索匹配相似的数据

9. 数据处理

从向量库中匹配到相似的数据后，系统将交由LLM 处理相关信息以对用户的问题制定详细的答案。

10. 数据呈现

最终，LLM将针对用户的问题，并结合向量库中匹配到的相似的数据分析，输出最终的语义化文本内容给用户

联系

博客: https://tycoding.cn
Github: https://github.com/tycoding
邮箱: langchat@outlook.com

原文地址:https://blog.csdn.net/TyCoding/article/details/140542989 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1814144141286838272.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-07-19 11:44:03 86 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-19 11:44:03 72 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-19 11:44:03 67 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-19 11:44:03 72 阅读
NoSQL之Redis非关系型数据库

2024-07-19 11:44:03 74 阅读
2024.7.22 作业

2024-07-19 11:44:03 74 阅读
GDB调试正在运行的程序

2024-07-19 11:44:03 59 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-19 11:44:03 60 阅读
在Django里面运行非项目文件

2024-07-19 11:44:03 58 阅读
SSD基本架构与工作原理

2024-07-19 11:44:03 64 阅读
在誉天学习完HCIE就业吗？

2024-07-19 11:44:03 71 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-19 11:44:03 61 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-19 11:44:03 65 阅读
go 协程池的实现

2024-07-19 11:44:03 64 阅读
Shell脚本循环语句与函数

2024-07-19 11:44:03 66 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-19 11:44:03 70 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-19 11:44:03 62 阅读
四大引用——强软弱虚

2024-07-19 11:44:03 67 阅读
Python语言-面向对象

2024-07-19 11:44:03 69 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-19 11:44:03 64 阅读
网站安全-CDN篇

2024-07-19 11:44:03 64 阅读

热门阅读

深入解析：Linux 软件包管理工具 `apt-get` 与 `apt` 的差异与应用

2024-07-19 11:44:03 21 阅读
unity渲染人物模型透明度问题

2024-07-19 11:44:03 19 阅读
学习补充008-xx-01 Migrations Overview（迁移概述）

2024-07-19 11:44:03 20 阅读
【C++深度探索】二叉搜索树的全面解析与高效实现

2024-07-19 11:44:03 20 阅读
浅谈Mqtt.fx

2024-07-19 11:44:03 21 阅读
Matlab-FPGA 小数转换为定点二进制小数脚本和转coe文件格式脚本

2024-07-19 11:44:03 21 阅读
哈喽GPT-4o，程序员如何通过GPT-4o保护自己的合法权益

2024-07-19 11:44:03 22 阅读
使用Vue实现点击页面触发特效

2024-07-19 11:44:03 21 阅读
支持向量机（SVM）

2024-07-19 11:44:03 21 阅读
Linux——开机重启、用户登录注销、用户管理、运行级别、帮助指令

2024-07-19 11:44:03 20 阅读
工作能力强的人，都会建立SOP

2024-07-19 11:44:03 21 阅读
7月18日学习打卡，数据结构堆

2024-07-19 11:44:03 25 阅读
最长上升子序列模板（LIS）

2024-07-19 11:44:03 22 阅读
护眼大路灯真的对眼睛好吗？五款对眼睛好的护眼大路灯分享

2024-07-19 11:44:03 22 阅读
STM32智能家居电力管理系统教程

2024-07-19 11:44:03 21 阅读
基于FPGA的多路选择器

2024-07-19 11:44:03 22 阅读
力扣3202：找出有效子序列的最大长度||

2024-07-19 11:44:03 15 阅读
Apache-BeanUtils VS SpringBean-Utils

2024-07-19 11:44:03 16 阅读
ArkTS-ArkUI-ForEach：循环渲染

2024-07-19 11:44:03 26 阅读
MySQL中为什么不推荐使用 text 类型？

2024-07-19 11:44:03 18 阅读
电子设计-入门教程-基础1

2024-07-19 11:44:03 24 阅读
linux下磁盘分区工具GParted

2024-07-19 11:44:03 20 阅读
人工智能导论-机器学习

2024-07-19 11:44:03 17 阅读
华为云认证

2024-07-19 11:44:03 19 阅读
TF和TF-IDF区别和联系

2024-07-19 11:44:03 19 阅读
鲁大师2024年新能源汽车半年报：小米SU7斩获车机流畅榜第一

2024-07-19 11:44:03 20 阅读
品牌进行电商数据采集的流程

2024-07-19 11:44:03 19 阅读
CentOS 7 Web面板的文件管理器说明

2024-07-19 11:44:03 19 阅读
学习记录--GPT

2024-07-19 11:44:03 20 阅读
双向链表专题

2024-07-19 11:44:03 16 阅读