当前位置: 代码迷 >> 综合 >> NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
  详细解决方案

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver

热度:12   发布时间:2023-11-23 21:52:33.0

问题描述:

Ubuntu装好CUDA之后过段时间输入

$nvidia-smi

查看自己的显卡信息时,结果报错:

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

解决办法:

一、用下面命令先挂载驱动,

modprobe nvidia

再用

nvidia-smi

检查是否加载成功,不成功的话采用下面的办法

二、重装Nvidia驱动

第一步:卸载原驱动

$sudo apt-get remove nvidia-*
$sudo apt-get autoremove

第二步:重新安装Nvidia驱动

# 以NVIDIA官方网站上的下载链接和安装文件名为准

wget https://cn.download.nvidia.cn/tesla/384.183/NVIDIA-Linux-x86_64-384.183.run

sudo sh NVIDIA-Linux-x86_64-384.183.run

安装过程忘了截图,自己选吧,基本一路yes,最后有个警告。(PS:找不到路径时,可以按这个提示修复吧(未证实))

                           

第三步:查看Nvidia驱动是否安装成功

      当安装完成后,运行下面的命令就可以看到该实例的GPU了。

nvidia-smi

                            

 

 

参考:

【1】Ubuntu 16.04 nvidia-smi报错(重装Nvidia驱动)

【2】AWS使用(四)——CUDN安装及对应tensorflow-gpu版本查找

  相关解决方案