大模型技术积累——模型压缩

2024-03-17 19:40:02
开发
34

总：模型压缩和加速方法

蒸馏（Distillation）

知识蒸馏：使用较大的模型预测结果来知道较小的，结构简单的模型学习。这样可以减小模型复杂度，提高模型的泛化能力和推理速度。

对抗蒸馏：在知识蒸馏的基础上，通过对抗训练来提高模型的鲁棒性和抗干扰能力

剪枝（Pruning）

参数剪枝：删除模型中冗余参数，减少模型大小。原因：一般只有小部分对参数贡献较大（激活函数前一或若干层的模型参数权重分配），其余参数对模型的贡献较小或没有贡献，可以删除冗余参数。

网络剪枝：删除冗余神经元。对比参数剪枝，可以仅删除神经元，不删除对应参数

网络裁剪：对不重要的连接进行裁剪，减少计算开销

量化（Quantization）

基础量化：浮点参数转换为更小的整数或低精度浮点数，减小模型参数和内存占用，提高计算效率

模型量化：模型的权重和激活函数精度从32位浮点数减小到16位浮点或8位整型

分解（Decomposition）

低秩分解（Low-Rank）：将一个较大的权重矩阵分解成几个小的权重矩阵，减少计算开销。代表成果：LoRA，QLoRA

卷积分解（CD）：卷积层分为几个更小的卷积层或全连接层，减小计算开销

分：大模型与知识蒸馏

知识蒸馏模型

FitNets:使用一个较大的模型作为教师（Teacher）来指导一个较小模型（Student）的训练

Hinton蒸馏：使用一个大型模型的输出作为标签来指导小型模型的训练

Born-Again Network（BAN）：使用一个已经选练好的模型来初始化一个新模型，然后使用少年数据重新训练模型

TinyBERT：使用一个大型BERT模型作为教师来指导小型BERT模型的训练

知识蒸馏及其改进方法

知识蒸馏与训练

分：模型量化

To be continue...

原文地址:https://blog.csdn.net/shuaikang9864/article/details/136780159 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1769327832380608512.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

大模型技术积累——模型压缩

2024-03-17 19:40:02 35 阅读
大模型知识积累——幻觉

2024-03-17 19:40:02 43 阅读
AI模型压缩技术

2024-03-17 19:40:02 53 阅读
什么是模型压缩技术

2024-03-17 19:40:02 101 阅读
设计模式【点滴积累】

2024-03-17 19:40:02 23 阅读
大模型技术的未来

2024-03-17 19:40:02 64 阅读
大模型量化技术-GPTQ

2024-03-17 19:40:02 41 阅读
DP状态压缩模型

2024-03-17 19:40:02 33 阅读
TensorRT模型压缩

2024-03-17 19:40:02 33 阅读
掌握大语言模型技术: 推理优化

2024-03-17 19:40:02 49 阅读

最近更新

题解 - 序列

2024-03-17 19:40:02 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-03-17 19:40:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-03-17 19:40:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-03-17 19:40:02 101 阅读
NoSQL之Redis非关系型数据库

2024-03-17 19:40:02 101 阅读
2024.7.22 作业

2024-03-17 19:40:02 98 阅读
GDB调试正在运行的程序

2024-03-17 19:40:02 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-03-17 19:40:02 85 阅读
在Django里面运行非项目文件

2024-03-17 19:40:02 82 阅读
SSD基本架构与工作原理

2024-03-17 19:40:02 87 阅读
在誉天学习完HCIE就业吗？

2024-03-17 19:40:02 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-03-17 19:40:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-03-17 19:40:02 86 阅读
go 协程池的实现

2024-03-17 19:40:02 89 阅读
Shell脚本循环语句与函数

2024-03-17 19:40:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-03-17 19:40:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-03-17 19:40:02 85 阅读
四大引用——强软弱虚

2024-03-17 19:40:02 87 阅读
Python语言-面向对象

2024-03-17 19:40:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-03-17 19:40:02 85 阅读
网站安全-CDN篇

2024-03-17 19:40:02 89 阅读