现象
云主机突然CPU告警,发现无法ssh登陆,ip可以ping通,相关服务也正常
报错
console口有大量audit:backlog limit exceeded报错
解决
重启服务器后恢复。
查看系统日志,有大量audit: audit_backlog=2049 > audit_backlog_limit=2048报错
audit服务是linux的一个审计服务,上述原因是audit服务在繁忙的系统中进行审计事件操作,缓冲瓶颈,导致系统崩溃
查看本机audit backlog_limit值
# auditctl -s
临时修改backlog_limit值
# auditctl -b 8192
重启生效
# echo auditctl -b 8192 >> /etc/rc.d/rc.local
# chmod +x /etc/rc.d/rc.local