大模型量化技术-GPTQ

大模型量化技术-GPTQ

2022年,Frantar等人发表了论文 GPTQ:Accurate Post-Training Quantization for Generative Pre-trained Transformers
在这里插入图片描述

在这里插入图片描述

这篇论文详细介绍了一种训练后量化算法,适用于所有通用的预训练 Transformer模型,同时只有微小的性能下降。

GPTQ算法需要通过对量化模型进行推理来校准模型的量化权重。详细的量化算法在原始论文中有描述。

基于auto-gptq 开源实现库,transformers 支持使用GPTQ算法量化的模型。
在这里插入图片描述

在这里插入图片描述

GPTQ:Accurate

相关推荐

  1. 模型RAG(二)向量化(embedding)

    2024-04-03 23:12:02       37 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-03 23:12:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-03 23:12:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-03 23:12:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-03 23:12:02       20 阅读

热门阅读

  1. Redis面试题15道

    2024-04-03 23:12:02       12 阅读
  2. pip install PyQt5 ssl error

    2024-04-03 23:12:02       13 阅读
  3. Python实战:打造学生信息管理系统

    2024-04-03 23:12:02       13 阅读
  4. PostCSS及其常用插件介绍

    2024-04-03 23:12:02       12 阅读
  5. 【python】网络爬虫——Scrapy

    2024-04-03 23:12:02       15 阅读