本篇是近期在classification-based 在anomaly detection 上有重大突破,想法也很简单,即data augmentation 运用。
是通过geometric transformation 将one-class 的normal data转成 multi-class,用标准的cross entropy 训练分类器,进行分类取得的结果就很惊艳。
整体可分成三部分:
1.Creating the Self-Labeled Dataset
2.Learning the Self-Labeled Dataset
3.Normality Score
对于Creating the Self-Labeled Dataset 部分,以rotation为例子,即向右旋转0,90,180,270
论文中采用rotation 4种 * translation (向上移动,向下,不移动)3种* (向左移动,向右移动,不移动)*3种*flip 是否翻转 2 种= 72,即将一类 transform 成多类。
Learning the Self-Labeled Dataset 这部分就是用自建的数据集去训练分类器,loss用标准的cross entropy 就行
Normality Score 这一部分是为了进一步提升性能;
测试的时候将测试资料送进来也进行上述的transformation,然后分别将各个类别对应的资料进行分类,并把正确类别的softmax值相加平均即可达到很准的地步。同时可以用训练资料集合,去算dirichlet normality,简单来说是算每一项分数应该占的比重,来提升表现性能。