Linux系统部署搭建AI私人知识库助手教程

前言

本篇文章教你如何搭建本地的私有大语言模型,和向量画数据库,实现一个本地的私有AI知识问答客服系统。需要用到的技术是开源项目由docker,fastgpt、one-api,开源LLM大模型,vllm或者ollama。

  • docker 是一款开源的应用容器引擎,用来快速构建服务。
  • fastgpt 基于LLM大模型的AI知识库构建平台。
  • one-api 是一个 OpenAI 接口管理 & 分发系统,可以通过标准的 OpenAI API 格式访问所有的大模型,开箱即用。
  • LLM大模型 (Large Language Model,简称LLM)是一种先进的人工智能技术,主要用于理解和生成人类语言。
  • Ollama 是一个开源的轻量级框架及命令行工具,设计用于本地部署和运行大型语言模型(LLMs)。
  • vLLM 大模型推理加速工具。

开启部署前,一张N卡,30系列或者40系列,或者A系列的都行,显存至少4G,内存至少8G,CPU四核即可。这样才能跑得动一个比较小的开源LLM模型。

Docker

首先现在linux系统上安装docker,方便后面快速安装和管理其他服务。
在 CentOS 系统上安装 Docker 的最新稳定版,可以按照以下步骤操作(截至2024年3月14日的信息):

第一步:准备工作

确保系统是最新的:

sudo

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-10 01:18:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-10 01:18:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-10 01:18:05       87 阅读
  4. Python语言-面向对象

    2024-04-10 01:18:05       96 阅读

热门阅读

  1. 工业通信原理——Modbus-TCP通信规约定义

    2024-04-10 01:18:05       29 阅读
  2. 网络基础——路由协议对比

    2024-04-10 01:18:05       39 阅读
  3. 前端saas化部署

    2024-04-10 01:18:05       32 阅读
  4. 【算法 & 动态规划 &路径问题】二维dp问题

    2024-04-10 01:18:05       39 阅读
  5. c++找最高成绩

    2024-04-10 01:18:05       34 阅读
  6. GraphVis的使用

    2024-04-10 01:18:05       41 阅读
  7. 从零开始学ChatGLM2-6B 模型基于 P-Tuning v2 的微调

    2024-04-10 01:18:05       33 阅读
  8. QT及C++中引用的用法和意义

    2024-04-10 01:18:05       31 阅读
  9. [ LeetCode ] 题刷刷(Python)-第70题:爬楼梯

    2024-04-10 01:18:05       37 阅读
  10. 大数据在医疗信息化中的应用

    2024-04-10 01:18:05       32 阅读
  11. 前端小白学习Vue2框架(一)

    2024-04-10 01:18:05       36 阅读
  12. 驾驭前端未来

    2024-04-10 01:18:05       33 阅读