求人脸底库匹配用时统计记录

1、

注意事项
1、预热
2、torch 异步

import torch
import time
torch.cuda.synchronize()

device = torch.device('cuda:2')
data_type = torch.float32

t1 = time.time()
a = torch.rand((40000000,512),dtype=data_type,device=device)
b = torch.rand((512,1),dtype=data_type,device=device)
t2 = time.time()

print('生成数据用时:',t2-t1)


#a = a.to(device)
#b = b.to(device)


t3 = time.time()
print('放入gpu用时:',t3-t2)
time.sleep(4)


#### 预热
t31 = time.time()
sim = torch.matmul(a, b)
print(torch.max(sim))
t32 = time.time()
print("第一次4000万数据耗时:",t32-t31)



t31 = time.time()
sim = torch.matmul(a, b)
print(torch.max(sim))
t32 = time.time()
print("第二次4000万数据耗时:",t32-t31)

a_ = 0
t4 = time.time()
for i in range(100):
    sim = torch.matmul(a, b)
    #a_ = torch.max(sim)
    a_ += sim[0][0]
    #torch.cuda.synchronize()  注意这条不行,从网上看到的说可以等到结果,结果不太行
print(a_)
t5 = time.time()

print("1000次测试4000万数据总耗时:",(t5-t4))

注:这里测试了几种在得到结果之后再统计时间的操作。均可以实现较为准确的统计(print(a_))一定要放在t5前。否则会直接跳出结果

注:torch.cuda.synchronize() 没毛用!

这里放出测试的结果:
在这里插入图片描述

相关推荐

  1. c语言统计m~n之间素数的个数,并素数的和。

    2024-02-22 23:42:03       37 阅读
  2. OpenCV学习记录——特征匹配

    2024-02-22 23:42:03       49 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-22 23:42:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-22 23:42:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-02-22 23:42:03       82 阅读
  4. Python语言-面向对象

    2024-02-22 23:42:03       91 阅读

热门阅读

  1. Web基础

    Web基础

    2024-02-22 23:42:03      55 阅读
  2. 深入理解Python爬虫的Response对象

    2024-02-22 23:42:03       56 阅读
  3. P5719 【深基4.例3】分类平均

    2024-02-22 23:42:03       55 阅读
  4. 开源软件的影响力

    2024-02-22 23:42:03       49 阅读
  5. linux命令--pidof

    2024-02-22 23:42:03       49 阅读
  6. springboot接收base64文件并上传

    2024-02-22 23:42:03       41 阅读
  7. 【达梦数据库】查看pesg回滚段信息的视图和SQL

    2024-02-22 23:42:03       53 阅读
  8. 数学术语之源——插值(interpolation)

    2024-02-22 23:42:03       56 阅读
  9. C和C++编译器标识符

    2024-02-22 23:42:03       57 阅读
  10. MQL语言实现单元测试

    2024-02-22 23:42:03       43 阅读
  11. 机器学习系列-机器学习范式

    2024-02-22 23:42:03       42 阅读
  12. RK3568 speex speexdsp降噪算法移植

    2024-02-22 23:42:03       60 阅读