CUDA锁页内存的使用

2023-12-14 10:58:02
开发
36

1.定义指针变量

float   *host_Weights;  // 锁页内存
float   *dev_Weights;  // 设备端内存

2.分配内存

cudaHostAlloc((void**)&host_Weights, numInputs * sizeof(float), cudaHostAllocDefault);  // 用锁页内存，可以有效加快数据传递速度
cudaMalloc((void**)& dev_Weights, numInputs* sizeof(float));  // 设备端内存

3.主机端内存的使用

for (int kk = 0; kk < numInputs; kk++)
{
   
  host_Weights[kk] = bpnn->mNeuronLayers[i]->mWeights[j][kk];
}

4.内存的拷贝（同步拷贝）

cudaMemcpy(dev_Weights,host_Weights,numInputs*sizeof(float),cudaMemcpyHostToDevice);     // dev_Weights是目标，host_Weights是源

5.核函数的使用

getNeuron << <1, 1>> > (dev_ Weights);   // dev_Weights是指针，所以前面不加位

6.核函数的形参

__global__ void getNeuron(float *dev_Weights)
{
   
   // dev_Weights使用时按照指针使用
}

7.内存的销毁

cudaFree(dev_Weights);
cudaFreeHost(host_Weights);

原文地址:https://blog.csdn.net/qq_37908389/article/details/105690025 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1735132007207407616.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

CUDA锁页内存的使用

2023-12-14 10:58:02 37 阅读
云计算基础-大页内存

2023-12-14 10:58:02 29 阅读
内存的分区

2023-12-14 10:58:02 18 阅读
如何让.NET应用使用更大的内存

2023-12-14 10:58:02 33 阅读
使用 STM32 的 DWT 单元监控内存

2023-12-14 10:58:02 19 阅读
Redis 内存的优化

2023-12-14 10:58:02 18 阅读
php 使用yield生成器节省内存

2023-12-14 10:58:02 16 阅读
寄存器、缓存、内存、硬盘、存储器的理解

2023-12-14 10:58:02 43 阅读
使用 Ant Design Pro 的图表（展示cpu、内存、硬盘）

2023-12-14 10:58:02 29 阅读
TCM SRAM等五块内存的使用和动态分配

2023-12-14 10:58:02 16 阅读

热门阅读

跨线程保持上下文

2023-12-14 10:58:02 38 阅读
选择大于努力-鸿蒙开发应用不适合当前企业的现状态（头部应用除外）推荐一套款平台框架可以写安卓iOS 鸿蒙为企业开源节流

2023-12-14 10:58:02 40 阅读
C语言结构体和位段

2023-12-14 10:58:02 39 阅读
linux的命令和vi的使用

2023-12-14 10:58:02 33 阅读
Fiddler抓包工具配置+Jmeter基本使用

2023-12-14 10:58:02 47 阅读
xtu oj 1271 color

2023-12-14 10:58:02 37 阅读
Ceph入门到精通-TCP和UDP相关的指标

2023-12-14 10:58:02 26 阅读
ceph-deploy 遇到的使用问题

2023-12-14 10:58:02 39 阅读
AIGC专题报告：ChatGPT的工作原理

2023-12-14 10:58:02 31 阅读
代码随想录算法训练营第二十四天（回溯算法篇）|理论基础，77. 组合

2023-12-14 10:58:02 40 阅读
堆和栈的区别

2023-12-14 10:58:02 33 阅读
springMVC-原理及入门案例

2023-12-14 10:58:02 36 阅读
会唱跳rap的汤姆猫确定不来了解一下嘛

2023-12-14 10:58:02 30 阅读
Redis队列原理解析：让你的应用程序运行更加稳定！

2023-12-14 10:58:02 25 阅读
Linux的五种IO模型

2023-12-14 10:58:02 29 阅读
Antv/G2 折线图 DataSet 数据处理过滤指定字段

2023-12-14 10:58:02 39 阅读
如何用CHAT写复习教案？

2023-12-14 10:58:02 37 阅读
构造列表存储1000以内的素数

2023-12-14 10:58:02 35 阅读
【计算思维】第14届蓝桥杯省赛计算思维U8组真题试卷

2023-12-14 10:58:02 38 阅读
【Django-03】模型常用的增删改查

2023-12-14 10:58:02 32 阅读
dell 恢复系统

2023-12-14 10:58:02 38 阅读
【Git使用总结】

2023-12-14 10:58:02 39 阅读
卷积神经网络

2023-12-14 10:58:02 47 阅读
debian12 最小化安装桌面 i3wm

2023-12-14 10:58:02 36 阅读
设计模式——观察者模式（Observer Pattern）

2023-12-14 10:58:02 42 阅读
算法训练营Day15(二叉树)

2023-12-14 10:58:02 42 阅读
时代在发展，我们不进步即被淘汰？我觉得......

2023-12-14 10:58:02 35 阅读
修改Docker0和容器的地址

2023-12-14 10:58:02 40 阅读
zabbix——实现高效网络监控

2023-12-14 10:58:02 46 阅读
H5页面生成工具源码

2023-12-14 10:58:02 43 阅读