当前位置: 代码迷 >> CUDA >> cuda核函数又调用核函数,多层并行
  详细解决方案

cuda核函数又调用核函数,多层并行

热度:843   发布时间:2016-04-29 10:44:24.0
cuda核函数再调用核函数,多层并行
#include <stdio.h>__global__ void childKernel(int i){	int tid = blockIdx.x*blockDim.x+threadIdx.x;	printf("parent:%d,child:%d\n",i,tid);	for(int j=i;j<i+10;j++)	{		printf(",%d",j);	}	printf("\n");}__global__ void kernel(){	int tid = blockIdx.x*blockDim.x+threadIdx.x;	childKernel<<<1,2>>>(tid);}int main(){	kernel<<<1,1>>>();	cudaDeviceSynchronize();return 0;}