ChatGLM3 Linux 部署

1.首先需要下载本仓库:

git clone https://github.com/THUDM/ChatGLM3

2.查看显卡对应的torch 版本

官方文档说明: Start Locally | PyTorch

例如:

a. 先查看显卡的CUDA版本

nvcc --version

查看对应版本

Previous PyTorch Versions | PyTorch

例如cuda 12.1 对应的torch 2.2.0

修改对应的torch版本

3.安装依赖

pip install -r requirements.txt

4.下载模型到本地

推荐在魔塔社区下载,相对比较快

魔搭社区

下载方式

在当前目录创建一个demo.py 文件

from modelscope import snapshot_download
model_dir = snapshot_download("ZhipuAI/chatglm3-6b", revision = "v1.0.0")

如下所示

安装依赖modelscope

pip install modelscope 后

运行demo.py文件

等待下载,下载后一般在这目录下

/root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b/

配置环境变量

在root目录下找到

.bashrc文件

在最后添加上MODEL_PATH,跟py代码中环境变量名保持一致

然后保存退出 重新加载一下该文件保证生效

source ~/.bashrc

然后进入项目地址 basic_demo 目录后运行web_demo_gradio.py

python web_demo_gradio.py

启动web_demo_gradio.py的话需要安装几个依赖

1、安装 peft

pip install peft

2、安装 gradio

pip install gradio

然后再启动

启动如果要内网映射到外网端口

在web_demo_gradio.py 代码最后

demo.launch(server_name="127.0.0.1", server_port=7870, inbrowser=True, share=False)

改成 

demo.launch(server_name="0.0.0.0", server_port=7870, inbrowser=True, share=False)

启动后如图:

---如果要启动api_server.py

需要下载

BAAI/bge-large-zh-v1.5

下载方式和下载模型一致

在当前目录创建一个demo2.py 文件

from modelscope import snapshot_download
model_dir = snapshot_download("AI-ModelScope/bge-large-zh-v1.5", revision='master')

下载完成后,地址跟模型地址差不多

新增一个

EMBEDDING_PATH

环境变量

方法

在root目录下找到

.bashrc文件

在最后添加上MODEL_PATH,跟py代码中环境变量名保持一致

然后保存退出 重新加载一下该文件保证生效

source ~/.bashrc

重新进入api_server.py目录

启动api_server.py

相关推荐

  1. docker一键部署GPU版ChatGLM3

    2024-03-22 17:38:07       34 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-22 17:38:07       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-22 17:38:07       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-22 17:38:07       82 阅读
  4. Python语言-面向对象

    2024-03-22 17:38:07       91 阅读

热门阅读

  1. C语言经典面试题目(二十二)

    2024-03-22 17:38:07       38 阅读
  2. 扫雷 游戏 题目

    2024-03-22 17:38:07       44 阅读
  3. 使用Docker搭建Logstash

    2024-03-22 17:38:07       42 阅读
  4. LeetCode-回文数

    2024-03-22 17:38:07       37 阅读
  5. 在linux中展示本月最后一个周五的日期

    2024-03-22 17:38:07       36 阅读
  6. 如何使用命令行查看服务器的核心数和内存大小

    2024-03-22 17:38:07       32 阅读
  7. WPF —— DataGrid数据网格

    2024-03-22 17:38:07       41 阅读
  8. 【统计学】独立同分布

    2024-03-22 17:38:07       28 阅读
  9. 工作中常用的git命令

    2024-03-22 17:38:07       35 阅读
  10. 后端开发辅助

    2024-03-22 17:38:07       41 阅读
  11. 【无人机综合考试题】

    2024-03-22 17:38:07       158 阅读
  12. 查找 Oracle 数据库中对象失效的原因和时间?

    2024-03-22 17:38:07       44 阅读