1、环境及相关配置
(1)服务器资源:微软开源人工智能集群管理平台(Open Platform AI, OpenPAI)分配的 docker 资源
(2)Docker 容器:Ubuntu 16.04.4 LTS(如:IP地址=192.168.1.1,指定端口=10001,登录方式=指定的 .pem 私钥文件)
(3)Python:Python 3.7.3(Anaconda3)
(4)Tensorflow & Tensorboard:1.14.0
(5)PC本机:macOS Mojave 10.14.5
(6)终端:terminal(其他终端命令工具应该也可以,没有具体测试,所以此处不列出)
2、具体操作
(1)私钥生成
从 OpenPAI 申请 GPU 服务器资源后,从相应的 ssh 登录下载私钥生成 .sh脚本文件,在终端 terminal 中运行,会在 .sh 相同的目录下得到一个 .pem 文件
sh 私钥生成的脚本指令.sh
(2)添加私钥文件
在终端 terminal 中运行如下命令(如果系统中无 ssh,需先安装 ssh)
ssh-add -k /username/Downloads/指定的私钥文件.pem
(注意:如果服务器资源是通过用户名和密码登录方式,可以略过以上两步)
(3)端口映射
将服务器开放的端口映射为 PC 本地端口(本实例:10001 -> 6006)
ssh -L 6006:127.0.0.1:6006 root@192.168.1.1 -p 10001
# ssh -L 本机端口:本机地址:本机端口 服务器用户名@服务器地址 -p 服务器开放端口
(注意:本机 IP 一般为 127.0.0.1,tensorboard 本机端口一般为 6006)
(4)运行 Tensorboard
在终端 terminal 上运行 tensorboard
tensorboard --logdir='/username/tensorboard日志所在的目录(注意是目录,不是日志文件)/'
(5)查看 Tensorboard 信息
在 PC 本地端的浏览器中输入“ http://127.0.0.1:6006/ ”,即可查看
(注意:这里不是终端运行 tensorboard 后提示的地址:“ http://32个字母地址:6006 ” )