12c,两个节点,其中节点1正常,节点2,数据库实例无法启动,crs服务无法启动;查看ocssd.log日志,显示
[509945600]clssnmvDHBValidateNCopy: node 1, redhat1, has a disk HB, but no network HB, DHB has rcfg 342097862
在网上查了很多资料,初步定位是两个节点间集群心跳检测失败;
我查看了节点1的网络配置,bond0为public ip,有3个子接口bond0:1 0:2 0:3每个子接口都有ip,bond1为私网接口,有一个子接口,bond 1:1 ip是169.254.214.69,bond0 bond1的ip都正确;
节点2 bond0 bond1 都没有子接口,ip也正确;
我怀疑是这里导致了心跳检测失败,但问题是bond0 bond1的子接口,我都没配置,不知道怎么回事,我检查过network-script中也没有子接口的配置文件,重启服务器后,那些子接口还是存在。
------解决思路----------------------
由于第二个节点挂掉,虚拟IP飘到了第一个节点上
因果关系搞反了
检查两节点之间的通讯