问题描述:
Ubuntu装好CUDA之后过段时间输入
$nvidia-smi
查看自己的显卡信息时,结果报错:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
解决办法:
一、用下面命令先挂载驱动,
modprobe nvidia
再用
nvidia-smi
检查是否加载成功,不成功的话采用下面的办法
二、重装Nvidia驱动
第一步:卸载原驱动
$sudo apt-get remove nvidia-* $sudo apt-get autoremove
第二步:重新安装Nvidia驱动
# 以NVIDIA官方网站上的下载链接和安装文件名为准
wget https://cn.download.nvidia.cn/tesla/384.183/NVIDIA-Linux-x86_64-384.183.run
sudo sh NVIDIA-Linux-x86_64-384.183.run
安装过程忘了截图,自己选吧,基本一路yes,最后有个警告。(PS:找不到路径时,可以按这个提示修复吧(未证实))
第三步:查看Nvidia驱动是否安装成功
当安装完成后,运行下面的命令就可以看到该实例的GPU了。
nvidia-smi
参考:
【1】Ubuntu 16.04 nvidia-smi报错(重装Nvidia驱动)
【2】AWS使用(四)——CUDN安装及对应tensorflow-gpu版本查找