CUDA：使用多个线程访问全局内存

asbest 发表于 Dev

石棉

我对以下内核有问题（我使用compute_30，sm_30对其进行了编译）：

__global__ void kernel(){
// globalThreadID:
int tidX = threadIdx.x + blockIdx.x * blockDim.x;

bool* array;
if (tidX == 1) array = new bool[10]; // allocate global array for every thread?!

if (tidX < 10)
{
    array[tidX] = calculate something;
}


read the array.....

}

在这里，CUDA调试器有时会抱怨9种访问冲突，而访问数组时我只会得到零！

有人知道为什么吗？

看守人

错误发生，因为array是一个螺纹范围在运行时堆aloocation。您仅使用为其分配线程tidX = 1。具有的线程tidX = {0,2,3,4,5,6,7,8,9}正试图取消引用未初始化的指针。显然，这将导致运行时访问失败。

编辑：

如果希望该数组对同一块中的每个线程可见并且可访问，则可以使用__shared__内存空间。如果希望数组对内核启动中的每个线程可见，则必须将其作为参数传递给内核，或者__device__在转换单元范围内将其声明为内存。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-20

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

CUDA：使用多个线程访问全局内存

CUDA：使用多个线程访问全局内存

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序