#include <stdio.h>__global__ void childKernel(int i){ int tid = blockIdx.x*blockDim.x+threadIdx.x; printf("parent:%d,child:%d\n",i,tid); for(int j=i;j<i+10;j++) { printf(",%d",j); } printf("\n");}__global__ void kernel(){ int tid = blockIdx.x*blockDim.x+threadIdx.x; childKernel<<<1,2>>>(tid);}int main(){ kernel<<<1,1>>>(); cudaDeviceSynchronize();return 0;}
详细解决方案
cuda核函数又调用核函数,多层并行
热度:843 发布时间:2016-04-29 10:44:24.0
相关解决方案
- CUDA/CUDA编程]请问一个调用CUFFT的有关问题[
- cuda 解实时h264流,d3d显示的有关问题
- CUDA - Shared Memory
- CUDA - CUDA库简介
- CUDA - Memory Access
- CUDA - Memory Model
- CUDA - Dynamic Parallelism
- CUDA - Branch Divergence and Unrolling Loop
- CUDA 六 - Warp解析
- CUDA 三 - 线程配置
- CUDA 四 - device管理
- CUDA 五 - GPU架构(Fermi、Kepler)
- CUDA 二 - 简介
- CUDA Runtime API 集锦
- cuda-convnet2与caffe对照
- Ubuntu14.04 64 位系统 装配 Cuda 6.5
- CUDA, 软件抽象的幻像背后 之二
- CUDA, 软件抽象的幻像背后
- CUDA系列学习(2)CUDA memory & variables
- CUDA系列学习(1)An Introduction to GPU and CUDA
- cuda-convnet 卷积神经网络 一般性构造卷积核个数 和 输入输出的关系以及输入输出的个数的说明
- cuda 1.x 编译器产生的奇怪有关问题及解决办法
- CUDA Kepler(1) Read-Only Cache特性解析及其性能对比测试
- cuda:在GPU内存中生成含有指针的结构体
- cuda error2019 没法解析外部符号
- CUDA samples 2.3节 用CUDA示范来创建CUDA项目
- CUDA samples 第三章 sample reference 简况
- CUDA by Example 4.2.2 一个有趣的例证 之 #include "gl_helper.h"
- GPU(CUDA)学习日志(八)- Parallel Nsight 调试经验; CUDA:no source correspandence for breakpoint以及nvcc 命令行
- CUDA SDK2.3 示范程序说明