前言
在公司对于运维人员来说,巡检是日常例行的一件事。刚刚开始服务器少,每次都是手动登录到服务器上做检查。可是服务器一多了,肯定是不能这样干的。因此我们就需要做一些比较自动化的行为。
程序说明
程序是通过使用python实现ssh连接到服务器去实行shell脚本,返回数据,并且生成excel,对不正常指标进行标红处理。
Python要实现ssh连接服务器还需要其他模块。
软件/模块 | 版本 | 其他 |
python | 2.7.9 | |
paramiko | 1.15.2 | |
xlwt | 1.0.0 |
本程序在win7 64bit使用是没有问题的(本人用的就是win7 64bit :) )
这边为了方便我提供了两个版本:
- python源码版:daily_check_py.zip
- 由于有些人在机器上没有安装python,所以这里我提供了一个将python转化为exe的版本。只要点击exe执行文件就能执行相关程序了:daily_check_exe.zip
程序流程
程序结构与程序说明
此程序由主程序、主机信息文件、命令文件三个文件组成。
1
2
3
4
5
6
|
`
--
daily_check
.
py
<
--此文件是
python的主程序
`
--日期
-
xunjian
.
txt
<
--生成的巡检信息文件
`
--
check
.
log
<
--日志文件
|
--
hosts
<
--存放着要执行那些命令和检查那些主机的文件
|
`
--
host
.
info
<
--存放着需要巡检的主机
IP和用户名密码
|
`
--
xx
.
xx
.
xx
.
xx
.
cmd
<
--存放相关主机需要执行的命令
|
执行了daily_check.py生成了xunjian.txt文件,我们需要将文件的内容都拷贝到一个excel文件中查看。并标出相关的预警的信息。如下:
上图显示了5列:
- 项目:检查了什么。
- 命令:检查使用的命令。
- 基线:比对的标准。
- 巡检情况:检查出来的信息。
- 主机:是在那台主机上检查的。
相关文件解释
这边就不说主程序文件了,有兴趣的可以自己去看。当然欢迎大家给出相关意见。
- *.cmd文件
此文件存放了巡检需要执行的命令、校验标准和命令是检查什么项目的,如下图:
以上文件的每一行分为3个部分:
- 校验项目。
- 校验shell命令。
- 校验标准:校验标准指定一个操作符号(>、<、=),具体用途例如:<85% 如果检查出来的结果 >85%就超标了。
以上三个部分是使用 “#” 分割(注意:请在命令中避免使用 “#”,以免出现程序分割错误)。
host.info文件
此文件中存放了需要巡检的主机的IP和用户名信息,它们使用空格分开,如果有不需要巡检的主机可以在里面使用 (#) 在注释,和shell脚本的注释是一样的。如图:
如果有行的服务器需要巡检,需要添加相关 主机 信息到此文件中。
执行巡检
- python程序巡检
- 需要接入生产环境,确保能使用相关用户访问相关服务器。
- 解压zip 文件。
- 运行py执行日常巡检。
- 查看生成的excel表,看是否有红色标注的异常(一般在swap上有小的使用可以不管)。
- 查看log,获得相关的日志信息。
- exe程序巡检
- 1、需要接入生产环境,确保能使用相关用户访问相关服务器。
- 2、解压zip。
- 进入到dist文件夹。
- 找到exe执行巡检。(注意执行完巡检相关的巡检excel和check.log存储在dist文件夹中。)
- 查看生成的excel表,看是否有红色标注的异常(一般在swap上有小的使用可以不管)。
- 查看log,获得相关的日志信息。
注意:exe巡检的*.cmd和host.info文件存放在dist/host文件夹中。
reference:
http://www.ttlsa.com/python/python-daily-check/