ptx学习

一 整体流程

1.1 头部信息

.version 8.2

.target sm_86

.address_size 64

  • .version 8.4:指定PTX代码的版本。
  • .target sm_86:目标架构是SM(Streaming Multiprocessor)86,代表某一代NVidia GPU架构。
  • .address_size 64:使用64位地址空间。

1.2 声明共享内存

.extern .shared .align 16 .b8 global_smem[];

 1.3 内核函数声明

.visible .entry reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de(

    .param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_0,

    .param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_1,

    .param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_2,

    .param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_3,

    .param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_4,</

相关推荐

  1. ptx学习

    2024-06-11 15:32:05       27 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-11 15:32:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-11 15:32:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-06-11 15:32:05       87 阅读
  4. Python语言-面向对象

    2024-06-11 15:32:05       96 阅读

热门阅读

  1. Jmeter函数二次开发说明

    2024-06-11 15:32:05       30 阅读
  2. SpringMVC

    SpringMVC

    2024-06-11 15:32:05      28 阅读
  3. ls命令(Linux)

    2024-06-11 15:32:05       36 阅读
  4. 徐州服务器租用的费用如何?

    2024-06-11 15:32:05       32 阅读
  5. i18next国际化(react)

    2024-06-11 15:32:05       28 阅读
  6. qt+ffmpeg实现视频转码功能(亲测好用)

    2024-06-11 15:32:05       33 阅读
  7. TensorFlow 的基本概念和使用场景

    2024-06-11 15:32:05       29 阅读
  8. 一些科学方法的总结

    2024-06-11 15:32:05       26 阅读
  9. 【Dify系列文章——Redis介绍】

    2024-06-11 15:32:05       26 阅读