3 HieRec
3.1 问题定义
新闻n的组成:
- title
- 文本序列 T ,w表示单词
- 实体序列 E ,e表示实体
- topic t
- subtopic s
用户的行为序列:
- M个点击的新闻
- 点击主题集合 {t1,t2,..,tm}\{ {t_1,t_2,..,t_m}\}{ t1?,t2?,..,tm?},一个用户点击过m个主题
- 对于m个主题中的每个主题tit_iti?,都有一个点击子主题集合 {sji}\{ {s^i_j}\}{ sji?} ,表示点击了第i个主题的第j个子主题(d个子主题)
- 点击的组 Nji={n1i,j,n2i,j,...,nli,j}N_j^i=\{n_1^{i,j},n_2^{i,j},...,n_l^{i,j}\}Nji?={ n1i,j?,n2i,j?,...,nli,j?} ,同一个主题和同一个子主题的新闻划分到一个组,组中新闻的数量为 lll
3.2 分层用户兴趣建模
3.3 分层用户兴趣匹配
3.4 新闻表示
4 Experiment
4.5 召回率和多样性表现