vLLM部署Qwen1.5-32B-Chat

2024-04-13 13:44:03
开发
20

vLLM部署Qwen1.5-32B-Chat

部署环境

操作系统：Ubuntu 20.04.2 LTS

Docker：v24.0.0

Docker Compose：v2.17.3

GPU：NVIDIA A100-SXM4-80GB

Nvidia Driver Version: 535.154.05

CUDA Version: 12.2

部署过程

模型文件下载

下载地址：通义千问1.5-32B-对话 · 模型库 (modelscope.cn)

下载方法：

SDK下载

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen1.5-32B-Chat', cache_dir='/path/to/your/model/dir/') # cache_dir指定模型保存目录

Git下载

git clone  https://www.modelscope.cn/qwen/Qwen1.5-32B-Chat.git

docker镜像构建

克隆Qwen1.5仓库：

git clone https://github.com/QwenLM/Qwen1.5.git

构建镜像：

原文地址:https://blog.csdn.net/hzhaoy/article/details/137687069 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1779022715714408448.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

vLLM部署Qwen1.5-32B-Chat

vLLM部署Qwen1.5-32B-Chat

部署环境

部署过程

模型文件下载

docker镜像构建

相关推荐

最近更新

热门阅读