面向AI2.0的高能效电路与系统设计——汪玉

源自2024年CCF大模型论坛清华大学教授汪玉老师的报告。

研究目标

在这里插入图片描述

在这里插入图片描述

核心思想

算法模型设计和剪枝可以降低工作负载,降低总计算量、存储量;
量化使得在单位面积内能够存放更多的算力,提升资源利用率。
在这里插入图片描述

具体实现

在这里插入图片描述
在这里插入图片描述

量化

根据量化敏感性为各层分配不同的量化位宽。
在这里插入图片描述

算子优化

负载小的算子切的细一点,提高并行度。
负载大的算子使用double buffer,重叠访存。
在这里插入图片描述

计算图优化

团队成就

在这里插入图片描述

相关推荐

  1. 关于设计和搭建Devops平台20高级面试

    2024-07-16 00:40:02       34 阅读
  2. 构建高效可靠消息队列系统设计实现

    2024-07-16 00:40:02       42 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 00:40:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 00:40:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 00:40:02       58 阅读
  4. Python语言-面向对象

    2024-07-16 00:40:02       69 阅读

热门阅读

  1. BCC工具命令报错解决步骤

    2024-07-16 00:40:02       21 阅读
  2. React

    React

    2024-07-16 00:40:02      19 阅读
  3. zookeeper+kafka消息队列群集部署

    2024-07-16 00:40:02       18 阅读
  4. MySQL架构详解

    2024-07-16 00:40:02       19 阅读
  5. 食品安全管理员考试真题题库及答案

    2024-07-16 00:40:02       19 阅读
  6. WPF TreeView 全选/反选/子级选中父级也选中

    2024-07-16 00:40:02       18 阅读
  7. 基于深度学习的文本摘要

    2024-07-16 00:40:02       22 阅读
  8. 基于深度学习的语音识别

    2024-07-16 00:40:02       24 阅读
  9. Ubuntu20.04.6新系统没有wifi驱动(已解决)

    2024-07-16 00:40:02       24 阅读
  10. dagger2实现原理

    2024-07-16 00:40:02       23 阅读
  11. html视差滚动效果

    2024-07-16 00:40:02       18 阅读
  12. Mac 安装npm

    2024-07-16 00:40:02       18 阅读