发布网友 发布时间:2022-04-20 16:33
共1个回答
热心网友 时间:2022-07-12 05:35
你好,
请把内存分配和传递部分去掉,这部分一般是不计在整体时间中的。其次,CUDA的第一条语句要比其他语句耗费的时间多很多,因为要初始化CUDA 的runtime库,你可以在你main函数里面统计时间前面加一条"cudaFree(0)",先初始化CUDA的runtime库,这样再测试时间就发现降下来很多了,谢谢。
望采纳追问那这样子cuda所用时间还是长啊,并未起到加速效果啊
追答能否把你修改过的代码贴上?