1、CUDA-5.5的新特性
- —— 动态并行(Dynamic Parallelism):GPU 加速新算法
GPU 线程可以动态地衍生新线程,从而更好地适应数据流。
通过最大程度地简化与 GPU 的往来通信,动态并行技术可以大大简化并行编程,
让更多流行算法支持 GPU 加速,比如自适应网格加密、计算流体动力学等等。
- —— GPU-Callable 库:支持第三方生态系统
新的 CUDA BLAS 库可以让开发人员为他们自己的 PU-Callable 库使用动态并行,
比如设计插件API、让其他人扩展其内核的功能性,部署 GPU Callback、自定义第三方 GPU-Callable 库的功能性。
对象链接(object linking)可将多个 CUDA 源文件编译成不同的对象文件,然后链接到更大的应用和库中,从而更简单、更高效地开发大型 GPU 应用。
- —— GPUDirect 支持 RDMA (远程直接内存访问):消除系统内存瓶颈
GPUDirect 技术建立了 GPU 与其它 PCI-E 设备的直接通信,并支持网卡与 GPU 之间的 RDMA,还能大幅降低集群中GPU 节点间的 MPISendRecv 延迟、改进整体应用性能。
- —— NVIDIA Nsight Eclipse Edition:快速简单地生成 GPU 代码
Linux、Mac OS X 平台上,NVIDIA Nsight Eclipse Edition 可以让开发人员在熟悉的 Eclipse IDE 环境内开发、调试和编译 GPU 应用,并自带 CUDA 编辑器和 CUDA 示例,可以更快地生成 CUDA 代码,还整合了专家级的分析系统,提供自动性能分析,以及修复代码中性能瓶颈的向导,还有语法高亮区分 GPU 代码和 CPU 代码。
CUDA 5 操作系统支持包括:Windows XP 台式机、Windows Vista/7/8 台式机和笔记本、Ubuntu 11.04/11.10、Fedora 16、Red Hat Enterprise Linux 5.x/6.x(后者仅限64位)、OpenSUSE 12.1(64位)、SUSE Server 11 SP1/SP2、Mac OS X。
2、准备工作
CUDA-5.5 安装包下载地址:http://developer.nvidia.com/cuda/cuda-downloads
我的系统是ubuntu12.04 32位的,所以选择下载Ubuntu 12.04 下面 32 位的 RUN 就可以了,600M+
检查电脑是否有支持 CUDA 的 GPU
lspci | grep -i nvidia
[email protected]:~$ lspci | grep -i nvidia01:00.0 VGA compatible controller: NVIDIA Corporation G98M [GeForce G 103M] (rev a1)
我的笔记本是 GeForce G 103M 型号的 GPU查看自己 GPU 型号是否支持 CUDA 可以参看官网文档:
官网文档:http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html
3、安装过程
安装build-essential安装包,以确保cuda及显卡驱动所需的gcc的安装
apt-get install build-essential
退出图形界面,进入控制台:
/etc/init.d/lightdm stop
按【Ctrl】+【alt】+【F1】进入控制台界面,运行如下命令:sudo sh cuda_5.5.22_linux_32.run
在此过程中,一开始会出来一个文档,比较长,可以通过按下按键【q】退出文档,然后输入【accept】就可以安装灵,一直按确认,默认安装即可,中间会选择驱动文件目录等。
设置环境变量:
在 /etc/profile 下添加如下语句
export PATH=$PATH:/usr/local/cuda-5.5/binexport LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-5.5/libsource /etc/profile
通过运行如上命令,可以生效 PATH。
退出控制台:
启动 lightdm 服务
service lightdm start
4、编译 Samples
直接运行 make 就可以编译 samples 里面的程序了。
随机找了一个例子运行如下: