llama.cpp运行qwen0.5B

2024-04-03 14:12:02
开发
39

编译llama.cp

下载模型

05b模型下载

转化模型

创建虚拟环境

conda create --prefix=D:\miniconda3\envs\llamacpp python=3.10
conda activate D:\miniconda3\envs\llamacpp

安装所需要的包

在这里插入图片描述

cd G:\Cpp\llama.cpp-master
pip install -r requirements.txt
python convert.py -h

在这里插入图片描述

执行转换命令

python convert.py G:\Python\Qwen1.5-0.5B-Chat --outfile G:\Cpp\qwenchat0.5b.gguf --outtype q8_0
python convert-hf-to-gguf.py G:\Python\Qwen1.5-0.5B-Chat  --outfile G:\Cpp\qwenchat0.5b.gguf
# 解释
# python 
# convert.py # convert.py路径
# /content/finetuned-2_merged # 模型路径
# --outfile finetuned-2.gguf # 要分配的gguf模型名称
# --outtype q8_0 #以8 Bit量化

在这里插入图片描述

将模型量化为5Bit（使用q5_k-m方法）

quantize.exe G:\Cpp\qwenchat0.5b.gguf qwenchat0.5b-q5_k_m.gguf q5_k_m

在这里插入图片描述

运行

# 注意Qwen模型要使用chatml prompt 模版
main.exe -m qwenchat0.5b-q5_k_m.gguf -n 512 --chatml

在这里插入图片描述

尝鲜通义千问1.8B
参考
 hf2gguf

原文地址:https://blog.csdn.net/qq_36437991/article/details/137248622 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1775405878871199744.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

llama.cpp运行qwen0.5B

2024-04-03 14:12:02 40 阅读
Ubuntu20.04配置qwen0.5B记录

2024-04-03 14:12:02 34 阅读
创新实训2024.06.03日志：完善Baseline Test框架、加入对Qwen-14B的测试

2024-04-03 14:12:02 19 阅读
【AI基础】第六步：纯天然保姆喂饭级-安装并运行qwen2-7b

2024-04-03 14:12:02 34 阅读
windows11 使用pytorch transformers运行Qwen2-0.5B-Instruct模型 (基于anaconda python虚拟环境管理平台)

2024-04-03 14:12:02 26 阅读
【深度学习】微调Qwen1.8B

2024-04-03 14:12:02 49 阅读
[大模型]Qwen-7B-Chat WebDemo

2024-04-03 14:12:02 36 阅读
Qwen1.5-1.8b部署

2024-04-03 14:12:02 17 阅读
llama.cpp部署通义千问Qwen-14B

2024-04-03 14:12:02 80 阅读
vLLM部署Qwen1.5-32B-Chat

2024-04-03 14:12:02 45 阅读

最近更新

题解 - 序列

2024-04-03 14:12:02 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-03 14:12:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-03 14:12:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-03 14:12:02 100 阅读
NoSQL之Redis非关系型数据库

2024-04-03 14:12:02 101 阅读
2024.7.22 作业

2024-04-03 14:12:02 98 阅读
GDB调试正在运行的程序

2024-04-03 14:12:02 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-03 14:12:02 85 阅读
在Django里面运行非项目文件

2024-04-03 14:12:02 82 阅读
SSD基本架构与工作原理

2024-04-03 14:12:02 87 阅读
在誉天学习完HCIE就业吗？

2024-04-03 14:12:02 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-03 14:12:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-03 14:12:02 85 阅读
go 协程池的实现

2024-04-03 14:12:02 89 阅读
Shell脚本循环语句与函数

2024-04-03 14:12:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-03 14:12:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-03 14:12:02 85 阅读
四大引用——强软弱虚

2024-04-03 14:12:02 86 阅读
Python语言-面向对象

2024-04-03 14:12:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-03 14:12:02 85 阅读
网站安全-CDN篇

2024-04-03 14:12:02 89 阅读

热门阅读

C语言牛客网BC-49 KIKI算数（难题详解）

2024-04-03 14:12:02 36 阅读
Unity与CocosCreator对比学习一

2024-04-03 14:12:02 35 阅读
python - 实现一个通用的插件类

2024-04-03 14:12:02 37 阅读
Matlab未装工具箱

2024-04-03 14:12:02 46 阅读
2024最新软件测试【测试理论+ 抓包与网络协议】面试题（内附答案）

2024-04-03 14:12:02 32 阅读
excel wps中编码格式转换

2024-04-03 14:12:02 43 阅读
Unity自定义框架开发

2024-04-03 14:12:02 36 阅读
路由和远程访问是什么？

2024-04-03 14:12:02 30 阅读
隐私计算实训营第七讲-隐语SCQL的架构详细拆解

2024-04-03 14:12:02 49 阅读
算法学习17：背包问题（动态规划）

2024-04-03 14:12:02 37 阅读
qtcreator配置msvc编译器 visual studio配置qt开发以及使用对比

2024-04-03 14:12:02 41 阅读
信创工程师招聘需求分析

2024-04-03 14:12:02 42 阅读
git常用命令

2024-04-03 14:12:02 39 阅读
C# 委托的基础应用

2024-04-03 14:12:02 30 阅读
qgroundcontrol 遥控器校准-问题解决

2024-04-03 14:12:02 28 阅读
【Docker】搭建便捷的Docker容器管理工具 - dockerCopilot

2024-04-03 14:12:02 41 阅读
【文化课学习笔记】【数学】复数

2024-04-03 14:12:02 35 阅读
自动化测试——面试题整理

2024-04-03 14:12:02 35 阅读
mysql 连接查询和子查询

2024-04-03 14:12:02 33 阅读
力扣54. 螺旋矩阵

2024-04-03 14:12:02 36 阅读
外贸网站源码定制：助您实现海外市场拓展

2024-04-03 14:12:02 39 阅读
了解黑客目的，防范黑客攻击

2024-04-03 14:12:02 34 阅读
STM32重要参考资料

2024-04-03 14:12:02 35 阅读
开源FLV播放器调研

2024-04-03 14:12:02 36 阅读
数据库排错记录

2024-04-03 14:12:02 37 阅读
[C/C++] -- 二叉树

2024-04-03 14:12:02 30 阅读
揭秘糖尿病患者稳定控制血糖的关键！

2024-04-03 14:12:02 37 阅读
rabbitmq调优--来自gpt

2024-04-03 14:12:02 38 阅读
钉钉服务端API报错错误描述: robot 不存在；解决方案:请确认 robotCode 是否正确

2024-04-03 14:12:02 29 阅读
京西商城——创建订单和获取订单接口

2024-04-03 14:12:02 37 阅读