InternLM2-lesson3作业+笔记

茴香豆

https://www.bilibili.com/video/BV1QA4m1F7t4/?vd_source=902e3124d4683c41b103f1d1322401fa

一、笔记

RAG

RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大预言模型的性能。它通过检索用户输入相关的信息片段,并结合这些信息来生成更准确、更丰富的回答。简而言之,RAG=搜索引擎+大模型
RAG工作原理

三种范式

Naive RAG→Advanced RAG→Modular RAG
在这里插入图片描述

优化方法
  • 嵌入优化
  • 索引优化
  • 查询优化
  • 上下文管理
  • 检索优化:迭代检索、递归检索、自适应检索
  • 大模型微调
    在这里插入图片描述
RAG vs 微调
RAG 微调
简介 非参数记忆;能够处理知识密集型任务;可以生成多样化内容 参数记忆;微调需要大量标注数据;可能存在过拟合
适用场景 适合信息更新较快的任务 适合高度专业化的任务
优势 动态知识更新,能处理长尾知识 可以针对特定任务优化
局限 依赖外部知识库的质量和大模型的能力 需要大量标注数据,不能很好适应新任务
大模型优化方法比较
  • 微调(Fine-tuning)
  • RAG
  • 提示词工程(Prompt Engineering)
  • 微调+RAG+提示词工程
    在这里插入图片描述

茴香豆

在这里插入图片描述

茴香豆是一个基于LLMs的领域知识助手,俗称豆哥。可以用作智能客服,或在即时通讯工具(IM),如微信群中高效解答问题
在这里插入图片描述

系统组成

知识库+前端+后端大模型+豆哥

  • 知识库:markdown、word、pdf、txt、ppt
  • 前端应用:微信、飞书等
  • 后端:本地大模型——书生浦语、通义千问;远程大模型api——chatgpt、chatglm等
  • 豆哥:豆哥负责整合、打通工作流,形成智能领域的知识问答助手
    豆哥的工作流程可以分为:预处理、拒答工作流和应答工作流
    在这里插入图片描述
    拒答工作流可以对提问进行打分,打分高的问题可以进入应答流进行回答。

二、基础作业

在 InternLM Studio 上部署茴香豆技术助手

(1)环境准备
从官方环境复制运行 InternLM 的基础环境
在这里插入图片描述
(2)安装茴香豆
基础模型文件
下载茴香豆代码
(3)搭建RAG助手
增加茴香豆相关的问题到接受问题示例中在这里插入图片描述

创建向量数据库
在这里插入图片描述在这里插入图片描述
运行RAG知识助手
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
除了一个问题以外,其余两个都没有回答!!!
单独提问也无法正常回答:
在这里插入图片描述

相关推荐

  1. IntermLM2】学习笔记

    2024-04-25 01:30:02       39 阅读
  2. InternLM 大模型实战】作业笔记汇总

    2024-04-25 01:30:02       57 阅读
  3. <span style='color:red;'>InternlM</span><span style='color:red;'>2</span>

    InternlM2

    2024-04-25 01:30:02      38 阅读
  4. <span style='color:red;'>2</span>.<span style='color:red;'>3</span><span style='color:red;'>作业</span>

    2.3作业

    2024-04-25 01:30:02      46 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-25 01:30:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-25 01:30:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-25 01:30:02       87 阅读
  4. Python语言-面向对象

    2024-04-25 01:30:02       96 阅读

热门阅读

  1. Cocos Creator 场景树与组件实例查找详解

    2024-04-25 01:30:02       33 阅读
  2. python

    python

    2024-04-25 01:30:02      29 阅读
  3. 为什么js无法通过contentDocument获取到iframe内容

    2024-04-25 01:30:02       32 阅读
  4. 2024年湖北专升本C语言模拟试卷

    2024-04-25 01:30:02       34 阅读
  5. K8S CronJob计划任务

    2024-04-25 01:30:02       32 阅读
  6. Docker搭建MinIO私有对象存储

    2024-04-25 01:30:02       33 阅读
  7. 软设之I/O数据传输控制方式

    2024-04-25 01:30:02       32 阅读
  8. VUE之旅—day1

    2024-04-25 01:30:02       28 阅读
  9. Cracking the Data Modeling Interview: Part 1 an Overview

    2024-04-25 01:30:02       34 阅读
  10. matlab2C【g=g1(465:615,200:350);】

    2024-04-25 01:30:02       34 阅读