当前位置: 代码迷 >> 综合 >> Mixed Negative Sampling for Learning Two-tower Neural Networks in Recommendations
  详细解决方案

Mixed Negative Sampling for Learning Two-tower Neural Networks in Recommendations

热度:48   发布时间:2023-12-14 09:52:28.0

文章目录

  • Mixed Negative Sampling for Learning Two-tower Neural Networks in Recommendations
      • (0) 个人小结
      • (1) 研究目标
      • (2) 研究方法

Mixed Negative Sampling for Learning Two-tower Neural Networks in Recommendations

(0) 个人小结

该文基于矩阵分解的思想,使用了双塔模型建模召回过程,该模型双塔分别为用户Embedding(文中称为Query Embedding)和item Embedding。在item Embedding中,考虑了item 的content,因此可以解决新item冷启动的问题。该模型将召回看作一个多分类问题,在推荐场景,类别巨大,一般使用层次softmax或sampled softmax,由于目标item(用户已安装且已使用的App)包含item的内容信息,上述两种方法不适用,所以该文使用了最近邻算法召回top k个item。

在采样时,使用了混合负采样:batch内负采样+物料池中均匀采样,batch内负采样符合unigram分布(即基于物品出现频率的采样),并且节省计算代价,但是存在偏差问题,负样本不包含长尾中item,因此引入了物料池中均匀采样。

(1) 研究目标

将双塔模型应该到谷歌商店APP推荐,使用混合负采样获得负样本,引入item的内容特征,有效解决新item冷启动问题。

(2) 研究方法

双塔模型的思想:

在这里插入图片描述

将Query input(用户特征)和item input分别映射为Embedding。

双塔模型在谷歌商店APP推荐的应用:

在这里插入图片描述

左边为用户的信息:用户特征、上下文特征和用户喜欢的APP(已安装&已使用),右边为候选APP的特征,将这些分别映射为查询Embedding和APP embedding。其中激活函数为ReLu。

谷歌商店 APP 推荐框架:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g7uch4uB-1617885114376)(img/image-20210408094024195.png)]

利用用户Embedding和Item Embeddding 进行先做召回,然后对召回结果进行重排。

双塔模型中batch负采样思想:

在这里插入图片描述

将同batch内的其他正样本作为该样本的负样本

双塔模型中混合负采样示例图:

在这里插入图片描述

在Item Embedding中,1~B是batch内负采样,1 ~ B’ 是从物料池中均匀负采样。矩阵 B* B 是正样本的label,其他地方为负样本的label,即为0。

  相关解决方案