当前位置: 代码迷 >> 综合 >> ubuntu16.04安装tensorflow-gpu-1.11.0+cuda9.0+cudn7
  详细解决方案

ubuntu16.04安装tensorflow-gpu-1.11.0+cuda9.0+cudn7

热度:18   发布时间:2024-01-06 11:46:54.0

1. 首先是安装ubuntu16.04,然后安装独立显卡驱动,这步骤我简单说明

关于ubuntu装机:

1.首先制作启动盘,注意一定要选择一个内核比较新版本的ubuntu iso文件
2.F12进入bios装机
F12--sandi--Install ubuntu--按步骤装:
English(选择语言)
Install third-party
something else

装机磁盘容量设置:
在这里插入图片描述

sudo apt-get update
sudo apt-get upgrade
然后直接进入系统设置里面–软件更新–额外驱动–选择安装
在这里插入图片描述

首先升级显卡驱动

准备工作就绪—开机F2—设置 secure boot –取消一个打勾的:
bios禁用禁用secure boot,也就是设置为disable

  1. 先正常进入ubuntu,卸载原显卡驱动
sudo apt-get remove –purge nvidia*
  1. 然后禁用开源驱动nea:
    sudo gedit /etc/modprobe.d/blacklist.conf

加参数到最底下回车另起一行内容为

blacklist nouveau

options nouveau modeset=0

保存再终端更新内核命令

sudo update-initramfs -u

然后好了以后重启电脑

  1. 开始安装
    英伟达官网下载驱动430.run( gtx 1050ti notebook):
    先按Ctrl + Alt + F1到控制台,关闭当前图形环境

sudo service lightdm stop(ubuntu 16.04)
ubuntu18.04(sudo telinit 3)

再安装驱动程序

cd /home/用户名

进入到驱动所在文件夹 (下好的驱动文件放在home 或者叫主文件夹下)

sudo chmod a+x NVIDIA-Linux-x86_64-xxx.run
sudo sh NVIDIA-Linux-x86_64-xxx.run -no-opengl-files

最后重新启动图形环境或者是在命令行环境下直接sudo reboot
sudo service lightdm start

参考:

https://blog.csdn.net/wf19930209/article/details/81877822

2. 看到了我的驱动为384,因此选择装cuda时为9.0

具体的驱动版本与cuda版本的关系如下:
在这里插入图片描述

2.1开始安装 cuda9.0

在这里插入图片描述
参考官网:

https://developer.nvidia.com/cuda-90-download-archive

2.2 安装cudnn7

在这里插入图片描述

参考官网:
https://developer.nvidia.com/rdp/cudnn-download

3.安装anaconda5.10

1.Ubuntu中自带python2.7和python3.5,但是很多情况下我们需要使用python3.6,以下是在终端中安装python3.6的详细步骤:
https://blog.csdn.net/sunshine_zkf/article/details/82841955
2.进入https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
下载安装文件
3.安装bash Anaconda3-5.1.0-Linux-x86_64.sh

4.使用anaconda中的pip安装tensorflow-gpu-1.11.0

这部分参考:
https://zhuanlan.zhihu.com/p/38243794
#对conda安装虚拟环境的理解
Anaconda中conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理与环境管理
在实际项目开发中,我们通常会根据自己的需求去下载各种相应的框架库,如Scrapy、Beautiful Soup等,但是可能每个项目使用的框架库并不一样,或使用框架的版本不一样,这样需要我们根据需求不断的更新或卸载相应的库
因此我们可以针对不同的项目开发不同的虚拟环境
#我的tensorflow就安装在虚拟环境tflab中
首先创建虚拟环境tflab
然后激活虚拟环境
再在虚拟环境中通过pip安装tensorflow
#可以看到,在主目录下conda list是看不到tensor-flow gpu的环境的
#但是进入tflab这个虚拟环境再conda list就可以看见了

在这里插入图片描述

5.关于pycharm配置anaconda的tensorflow虚拟环境

在这里插入图片描述
在这里插入图片描述
#注意是在conda创建的虚拟环境tflab下,因为你是在这个虚拟环境下下载的tensorflow-gpu

这个路径怎么得来的,在source activate tflab后,见图片
注意测试时:
impot tensorflow as tf #tensorflow小写

在这里插入图片描述
主要reference:
https://www.zhihu.com/search?q=tensorflow%20ubuntu&utm_content=search_history&type=content

https://blog.51cto.com/8764888/2296248
安装python3.6
https://blog.csdn.net/qq_37659064/article/details/79329156

后续问题

jupyter notebook 里面 import tensorflow报错

主要原因是,annaconda安装时,还没有创建虚拟环境,你在虚拟环境下安装的tensorflow-gpu
现在你需要在虚拟环境里面重新安装jupyter
参考:
https://blog.csdn.net/m0_37393514/article/details/81390509

anaconda卸载

https://blog.csdn.net/ztf312/article/details/80830170

6.安装cuda10.1及cudnn7.5

因为更新了驱动为430,所以要升级为10.1,cudnn的版本也要对应更新,因为cudnn的安装实际为将几个文件复制到cuda10.1文件夹下,所以主要应对cuda的卸载,cudnn也就卸载了
卸载的部分参考:

https://blog.csdn.net/qq_33200967/article/details/80689543
帖子里:
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
sudo rm -rf /usr/local/cuda-8.0/
我没有uninstall_cuda_8.0.pl文件,所以就直接删除文件夹了
注意的是cuda与cuda-9.0建立了软链接

关于cuda10.1的安装参考:

https://blog.csdn.net/weixin_42089273/article/details/103171756
https://blog.csdn.net/sss_369/article/details/94591280
(包括pytorch)https://blog.csdn.net/weixin_42089273/article/details/103171756
注意的是,不要重新安装驱动了

cudnn更换版本切换软连接

https://blog.csdn.net/wjx1290326396/article/details/79919233?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-9&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-9
主要是几个libcudd.so文件的替换,以及软连接设置

anaconda库离线下载,清华源:

https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/linux-64/

安装TensorRT 5.02

安装按照官网的指导: 4.4.Tar File Installation
也参考了这个网址:
https://blog.csdn.net/u011681952/article/details/105973996

gcc 多版本切换

https://www.shuzhiduo.com/A/n2d9GkD6JD/
https://www.jianshu.com/p/0caef3ce8e06

在这里插入图片描述

ubuntu shutter图片编辑功能的修复

参考:
https://itsfoss.com/shutter-edit-button-disabled/