2021-WSDM 阿里团队 召回
发现用户的行为序列通常包含多个概念上不同的物品,而统一的嵌入向量主要受到最近频繁行为的影响。本文提出Sparse Interest NEtwork,核心是稀疏兴趣模块和兴趣聚合模块:
- 稀疏兴趣模块,自适应地从大型概念池中推断出每个用户的一组稀疏概念,并输出对应的多个嵌入
- 兴趣聚合模块,主动预测用户的当前意图,然后使用它显式地对next item预测进行建模
1 INTRODUCTION
- 传统的推荐方法——协同过滤
- 基于深度神经网络的推荐——NCF、PinSage;忽略了序列结构
- 序列推荐——输入user的点击序列,使用RNN/CNN/Transformer得到user的一个嵌入
- 电子商务平台中的用户随着时间变化,会交互不同概念级别的物品;而从行为序列中学习到的整体用户嵌入向量主要受到最近最频繁的items的影响;大意就是如果和next item属于相似类别的item出现在用户的序列中了,那么预测next item还算准确,但是如果没有出现过的话,预测效果会变差;——从用户序列中学习多个用户嵌入,每个表示用户在某方面的兴趣
从用户历史序列中提取多个嵌入向量的挑战有:
- items在概念上聚类的效果并不好(这里经常使用类别信息作为概念)
- 要从巨大的概念池(concept pool)中自适应地推断出用户少量稀疏的感兴趣的概念集合,推理过程包括一个选择操作,这是一个离散的优化问题,很难端到端训练
- 给定多个兴趣嵌入向量,在预测下一个items时我们需要确定哪些兴趣可能会被激活
3 METHODOLOGY
3.1 符号定义和问题描述
- N用户,M物品
- 用户的物品点击序列 xu=[x1u,x2u,...,xnu]x^u=[x^u_1,x^u_2,...,x^u_n]xu=[x1u?,x2u?,...,xnu?]
- 模型用于召回阶段
3.2 稀疏兴趣框架
3.3 兴趣聚合模块
3.4 模型优化
3.5 与现有模型的关系
4 EXPERIMENTS