CUDA | 线程模型结构

  • grid ==> 网格;
  • block ==> 线程块;

  • 线程分块是逻辑上的划分,物理上线程不分块

  • 配置线程: <<<grid_size, block_size>>>

  • 最大允许线程块大小:1024
  • 最大允许网格大小:2^31 - 1 (针对一维网格)

  • 每个线程在核函数中都有一个唯一的身份标识;
  • 每个线程的唯一标识由这两个 <<<grid_size, block_size>>> 确定;grid_size,block_size 保存在内建变量 (build-in variable),目前考虑的是一维的情况:
    • gridDim.x:该变量的数值等于执行配置中变量 grid_size 的值;
    • blockDim.x:该变量的数值等于执行配置中变量 block_size 的值;
  • 线程索引保存成内建变量 (build-in variable):
    • blockIdx.x:该变量指定一个线程在一个网格中的线程块索引值,范围为 0~gridDim.x-1;
    • threadIdx.x:该变量指定一个线程在一个线程块中的线程索引值,范围为 0~blockDim.x-1;
    • 比如 kernel_fun<<<2, 4>>>(),示意图如下。那么线程唯一标识:Idx = threadIdx.x + blockIdx.x * blockDim.x,其中 gridDim.x 值为 2、blockDim.x 值为 4、blockIdx.x 的取值范围为 0~1、threadIdx.x 的取值范围为 0~3;

相关推荐

  1. 鸿蒙 线模型

    2024-03-23 07:44:01       37 阅读
  2. Redis 线模型

    2024-03-23 07:44:01       40 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-23 07:44:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-23 07:44:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-23 07:44:01       82 阅读
  4. Python语言-面向对象

    2024-03-23 07:44:01       91 阅读

热门阅读

  1. 【无标题】vscode setting配置

    2024-03-23 07:44:01       42 阅读
  2. C语言如何计算字符串中有多少个单词?

    2024-03-23 07:44:01       42 阅读
  3. SQLAlchemy快速入门

    2024-03-23 07:44:01       40 阅读
  4. Oracle 去除重复记录SQL

    2024-03-23 07:44:01       38 阅读
  5. IOS面试题编程机制 16-20

    2024-03-23 07:44:01       37 阅读
  6. 机器学习流程—迁移学习 模型微调

    2024-03-23 07:44:01       46 阅读
  7. PyTorch Lightning 与 TensorBoard 问题解决文档

    2024-03-23 07:44:01       39 阅读