0, GPU Microarchitecture介绍

目前,国内GPU的研发比较火,总体上来讲,国内GPU初创公司主要是以GPGPU为主,主要玩家是以买IP来实现前端设计的方式,总体上对整个GPU的软件生态,linux图形技术栈的理解,对OS以及相应的编译器的投入还需要加强。那么如何从零到一实现一个GPU的设计,是一个复杂的技术性问题,后续,我将会做为一个系列,来介绍如何从零开始实现一款全新的GPU。

一,GPU最早主要是Nvidia和ATI推出的图形渲染加速处理器,这种以异构并行加速处理图形渲染的芯片,主要用于2D/3D游戏,3D动画,VR等图形渲染加速。显卡里面的GPU在游戏玩家跑分测试拼性能的过程中,迭代开发累计了成千上万颗cores在一个GPU芯片里面。使得异构并行计算时代加速到来。

二,后来,由于AI对算力的需求,AI开发工程师发现GPU的众核并行计算能力具有天然的并行加速能力,对OpenGL进行一定的接口适配,利用compute shader就可以利用GPU的并行多核加速提升AI算力。后面就催生了Cuda,OpenCL这样的异构并行计算软硬件生态度和相应的编程模型。GPU的异构并行这种能力,在国内一种初创公司中就活跃起来了,主要的方法就是把原本GPU中具有的图形渲染和通用计算视频编解码功能,进行了阉割版,只是实现其中的通用计算能力取名叫做GPGPU。

三,要实现GPU从零到一的微架构搭建,还得从GPU的最早的一般GPU的实现过程方法来分析,这样可以得到最原生的GPU/GPGPU的微架构实现方法。

实际上,现代的GPU/GPGPU,内部结构非常复杂,要说明白其结构原理,并从软硬件框架,linux图形技术栈,AI通用技术栈等方面解

相关推荐

  1. 0开篇-介绍

    2024-06-18 17:18:05       30 阅读
  2. 0, GPU Microarchitecture介绍

    2024-06-18 17:18:05       32 阅读
  3. MySQL8.0默认TCP端口介绍

    2024-06-18 17:18:05       30 阅读
  4. UML2.0 14种图简单介绍

    2024-06-18 17:18:05       52 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-18 17:18:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-18 17:18:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-06-18 17:18:05       87 阅读
  4. Python语言-面向对象

    2024-06-18 17:18:05       96 阅读

热门阅读

  1. Vue 3 的 Teleport 组件实现跨层级通信

    2024-06-18 17:18:05       37 阅读
  2. 萤石视频接入api接口示例

    2024-06-18 17:18:05       35 阅读
  3. 速盾:高防服务器防御 DDoS 攻击的掩护技巧

    2024-06-18 17:18:05       30 阅读
  4. stringstream的使用

    2024-06-18 17:18:05       34 阅读
  5. Spring Boot常用注解

    2024-06-18 17:18:05       34 阅读
  6. 近期学习文章

    2024-06-18 17:18:05       31 阅读
  7. 2024.06.05校招 实习 内推 面经

    2024-06-18 17:18:05       34 阅读
  8. 日语 9 10

    2024-06-18 17:18:05       35 阅读
  9. Swift Combine — Publisher、Operator、Subscriber概念介绍

    2024-06-18 17:18:05       32 阅读
  10. Thymeleaf 全局变量

    2024-06-18 17:18:05       36 阅读
  11. 微信小程序---支付

    2024-06-18 17:18:05       30 阅读
  12. CORE公链

    2024-06-18 17:18:05       31 阅读