GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构

GPU 架构概述

本文主要介绍 NVIDIA GPU 每一代架构的技术发展和架构之间的区别和联系,时间跨度从 2010 年至 2017 年,包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构。

架构名称 Fermi Kepler Maxwell Pascal Volta
中文名字 费米 开普勒 麦克斯韦 帕斯卡 伏特
发布时间 2010 2012 2014 2016 2017
核心参数 16 个 SM,每个 SM 包含 32 个 CUDA Cores,一共 512 CUDA Cores 15 个 SMX,每个 SMX 包括 192 个 FP32+64 个 FP64 CUDA Cores 16 个 SM,每个 SM 包括 4 个处理块,每个处理块包括 32 个 CUDA Cores+8 个 LD/ST Unit + 8 SFU GP100 有 60 个 SM,每个 SM 包括 64 个 CUDA Cores,32 个 DP Cores 80 个 SM,每个 SM 包括 32 个 FP64+64 Int32+64 FP32+8 个 Tensor Cores
特点&优势 首个完整 GPU 计算架构,支持与共享存储结合的 Cache 层次 GPU 架构,支持 ECC GPU 架构 游戏性能大幅提升,首次支持 GPU Direct 技术 每组 SM 单元从 192 个减少到每组 128 个,每个 SMM 单元拥有更多逻辑控制电路 NVLink 第一代,双向互联带宽 160GB/s,P100 拥有 56 个 SM HBM NVLink2.0,Tensor Cores 第一代,支持 AI 运算,NVSwitch1.0
纳米制程 40/28nm 30 亿晶体管 28nm 71 亿晶体管 28nm 80 亿晶体管 16nm 153 亿晶体管 12nm 211 亿晶体管
代表型号 Quadro 7000 K80 K40M M5000 M4000 GTX 9XX 系列 P100 P6000 TTX1080 V100 TiTan V

现代计算机的内存结构主要如下:

Fermi 架构

2010 年 NVIDIA 提出 Feimi 架构,最大可支持 16 个 SMs,每个 SM 有 32 个 CUDA Cores,一共 512 个 CUDA Cores,架构设计主要是以

相关推荐

  1. 方程组推出均匀平面电磁波及其特征

    2024-05-01 13:52:02       51 阅读
  2. 里姆(prim)尔(Kruskal)

    2024-05-01 13:52:02       47 阅读
  3. Prometheus()简介(1)

    2024-05-01 13:52:02       37 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-05-01 13:52:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-05-01 13:52:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-05-01 13:52:02       82 阅读
  4. Python语言-面向对象

    2024-05-01 13:52:02       91 阅读

热门阅读

  1. 什么是ASO?

    2024-05-01 13:52:02       29 阅读
  2. 成长的88个表

    2024-05-01 13:52:02       31 阅读
  3. Stable Diffusion 本地部署教程

    2024-05-01 13:52:02       37 阅读
  4. VueRouter

    VueRouter

    2024-05-01 13:52:02      35 阅读
  5. 【C】153 寻找旋转排序数组中的最小值

    2024-05-01 13:52:02       29 阅读
  6. 如何快速找到并处理jar依赖冲突问题

    2024-05-01 13:52:02       35 阅读
  7. 最短路计数(BFS)

    2024-05-01 13:52:02       29 阅读