背景
我们有很多replace 的分钟级别任务,
- 功能:是对一个正表A进行实时更新的
- 流程
drop A_tmp;
create A_tmp lik A;
Insert into A_tmp select ******;
alter table A replace with A_tmp swap=true
一分钟有好多tmp表被删除…
之前swap=false不是会有tablet只增不减的问题嘛,所以改成true,然后任务开始的时候手动删除tmp表
异常告警狂刷日志
升级到0.14后
master节点fe.log
狂刷告警日志
[MasterImpl.finishTask():102] finish task reports bad.
request: TFinishTaskRequest(backend:TBackend(host:be-host1, be_port:9060, http_port:8040), task_type:DROP, signature:472091734, task_status:TStatus(status_code:NOT_FOUND, error_msgs:[]))
be也狂刷告警
W0812 10:16:56.461318 94922 tablet_manager.cpp:486] fail to drop tablet because it does not exist. tablet_id=472091734, schema_hash=1198216438
解决办法
误打正着
我们要对集群be节点进行扩容
然后需要滚动重启be节点
操作完之后就恢复了,日志不再狂刷,但是担心后续还会产生这个问题,所以正在排查