fastllm将chatglm3-6b转成flm文件的正确方式

2024-03-31 00:48:03
开发
41

fastllm将chatglm3-6b转成flm文件的正确方式：

from modelscope import AutoTokenizer, AutoModel, snapshot_download
import torch2flm
model_dir = snapshot_download("ZhipuAI/chatglm3-6b", revision = "v1.0.0")
tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
model = AutoModel.from_pretrained(model_dir, trust_remote_code=True).half().cuda()
model = model.eval()


torch2flm.tofile("/mnt/workspace/chatglm3-6b-int4.flm", model.to("cpu") , tokenizer, dtype="int4")

原文地址:https://blog.csdn.net/wtl1992/article/details/137179844 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1774116387191656448.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

fastllm将chatglm3-6b转成flm文件的正确方式

2024-03-31 00:48:03 42 阅读
chatglm3-6b使用

2024-03-31 00:48:03 57 阅读
chatglm3-6b小试

2024-03-31 00:48:03 32 阅读
ChatGLM3-6B的本地api调用

2024-03-31 00:48:03 63 阅读
6、ChatGLM3-6B 部署实践

2024-03-31 00:48:03 41 阅读
用通俗易懂的方式讲解大模型：在 CPU 服务器上部署 ChatGLM3-6B 模型

2024-03-31 00:48:03 43 阅读
【AI】ChatGLM3-6B上手体验

2024-03-31 00:48:03 69 阅读
11.QLoRA微调ChatGLM3-6B

2024-03-31 00:48:03 33 阅读
llama-index 结合chatglm3-6B 利用RAG 基于文档智能问答

2024-03-31 00:48:03 42 阅读
【工程记录】ChatGLM3-6B微调实践的更新说明

2024-03-31 00:48:03 33 阅读

最近更新

题解 - 序列

2024-03-31 00:48:03 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-03-31 00:48:03 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-03-31 00:48:03 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-03-31 00:48:03 100 阅读
NoSQL之Redis非关系型数据库

2024-03-31 00:48:03 101 阅读
2024.7.22 作业

2024-03-31 00:48:03 98 阅读
GDB调试正在运行的程序

2024-03-31 00:48:03 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-03-31 00:48:03 85 阅读
在Django里面运行非项目文件

2024-03-31 00:48:03 82 阅读
SSD基本架构与工作原理

2024-03-31 00:48:03 87 阅读
在誉天学习完HCIE就业吗？

2024-03-31 00:48:03 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-03-31 00:48:03 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-03-31 00:48:03 85 阅读
go 协程池的实现

2024-03-31 00:48:03 89 阅读
Shell脚本循环语句与函数

2024-03-31 00:48:03 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-03-31 00:48:03 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-03-31 00:48:03 85 阅读
四大引用——强软弱虚

2024-03-31 00:48:03 86 阅读
Python语言-面向对象

2024-03-31 00:48:03 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-03-31 00:48:03 85 阅读
网站安全-CDN篇

2024-03-31 00:48:03 89 阅读

热门阅读

基于easyx库的C/C++游戏编程实例-飞机大战

2024-03-31 00:48:03 49 阅读
Centos7安装RTL8111网卡驱动

2024-03-31 00:48:03 37 阅读
LATTICE进阶篇DDR2--(0)获取ddr2 IP核

2024-03-31 00:48:03 39 阅读
在Python中进行封装

2024-03-31 00:48:03 40 阅读
【C语言】memcpy 使用和模拟实现

2024-03-31 00:48:03 38 阅读
【No.21】蓝桥杯组合数学|数位排序|加法计数原理|乘法计数原理|排列数|组合数|抽屉原理|小蓝吃糖果|二项式定理|杨辉三角|归并排序(C++)

2024-03-31 00:48:03 35 阅读
IDE/VS2015和VS2017帮助文档MSDN安装和使用

2024-03-31 00:48:03 44 阅读
攻防世界-easyphp

2024-03-31 00:48:03 45 阅读
C#调用C++ （使用C++/CLI）

2024-03-31 00:48:03 40 阅读
如何处理Redis服务器宕机的情况

2024-03-31 00:48:03 43 阅读
【线上环境更换国产麒麟银河服务器之后FTP无法解析文件字符串的问题】

2024-03-31 00:48:03 37 阅读
嵌入式linux学习之交叉编译器安装

2024-03-31 00:48:03 43 阅读
（学习日记）2024.03.25：UCOSIII第二十二节：系统启动流程详解

2024-03-31 00:48:03 38 阅读
linux安装Redis

2024-03-31 00:48:03 40 阅读
数据结构：Trie（前缀树/字典树）

2024-03-31 00:48:03 46 阅读
C++ | filesystem file not found

2024-03-31 00:48:03 48 阅读
brctl 命令

2024-03-31 00:48:03 44 阅读
Spring Data Elasticsearch 与ES版本对应关系记录

2024-03-31 00:48:03 49 阅读
算法学习——LeetCode力扣图论篇1

2024-03-31 00:48:03 38 阅读
LeetCode - 数组乘积中的不同质因数数目

2024-03-31 00:48:03 50 阅读
Spring Boot整合MyBatis-Plus，并通过AutoGenerator生成项目骨架代码

2024-03-31 00:48:03 47 阅读
ChatGPT写作攻略：完善学术论文技巧指南

2024-03-31 00:48:03 42 阅读
【Python File文件处理】

2024-03-31 00:48:03 43 阅读
LVS几种模式介绍

2024-03-31 00:48:03 45 阅读
Linux IRC

2024-03-31 00:48:03 41 阅读
【Go】三、Go指针

2024-03-31 00:48:03 47 阅读
工作日志- 不定期更新

2024-03-31 00:48:03 44 阅读
第四章、页面组件

2024-03-31 00:48:03 41 阅读
P19：注释

2024-03-31 00:48:03 37 阅读
Python 妙用运算符重载——玩出“点”花样来

2024-03-31 00:48:03 32 阅读