Positive & Unlabeled Data Learning(第一弹)
最近做的东西遇到了瓶颈,最近想从PU Learning这寻找一点灵感,所以接下来打算开个专题,陆续记录下自己最近看到的PU learning的文章。水平有限,非常欢迎大家可以多交流,讨论,一起进步!
所谓PU learning就是说我们收集得到的数据一般只有positive-only data,也就是说只有正样本,和一些没有标注的unlabeled data,对于这部分未标注的数据我们不清楚它到底是negative 还是positive。 很多场景下都有这种数据情况,比如知识图谱,自然语言处理,推荐系统等。(推荐系统中,我们只能收集到用户的正反馈信息,对于用户的unlabelled data是不太好定义何为negative 何为positive的)
关于PU learning的学习,现有的解决办法分为:(1)负采样。从大量的unlabeled data中按某些预先设定好的复杂or简单的分布采样出一些负样本,和positive data一起训练。(2) full batch。将所有unlabelled data当成负样本参与训练。但是两种方法都各有优劣。负采样的方法,虽然极大减少了样本space,但是会带来诸如收敛慢,收敛波动,真实的训练和采样的训练存在偏差等,这些都造成了其可能会收敛到一个次优解。full batch的方法,虽然可以得到更好的模型performance,但是其亟待解决的就是整个样本空间过大,训练复杂度技高。
今天主要是PU Learning第一弹