一 整体流程
1.1 头部信息
.version 8.2
.target sm_86
.address_size 64
.version 8.4
:指定PTX代码的版本。.target sm_86
:目标架构是SM(Streaming Multiprocessor)86,代表某一代NVidia GPU架构。.address_size 64
:使用64位地址空间。
1.2 声明共享内存
.extern .shared .align 16 .b8 global_smem[];
1.3 内核函数声明
.visible .entry reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de(
.param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_0,
.param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_1,
.param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_2,
.param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_3,
.param .u32 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_4,</