当前位置: 代码迷 >> 综合 >> Collaborative Topic Modeling for Recommending Scientific Articles
  详细解决方案

Collaborative Topic Modeling for Recommending Scientific Articles

热度:65   发布时间:2023-12-06 04:14:01.0

目录

      • ABSTRACT
      • 2. BACKGROUND
        • 2.2 Recommendation by Matrix Factorization
        • 2.3 Probabilistic Topic Models
      • 3. COLLABORATIVE TOPIC REGRESSION

ABSTRACT

提出了CTR算法,结合了CF和概率主题模型(用的LDA)

  • 准确率提升
  • 可解释的用户和物品隐向量
  • 文章的冷启动

2. BACKGROUND

2.2 Recommendation by Matrix Factorization

传统的矩阵分解:
在这里插入图片描述
在这里插入图片描述
带有正则化系数。
这种协同过滤的矩阵因式分解可以推广为概率模型[18]
在这里插入图片描述
在这里插入图片描述
其中 cijc_{ij}cij?rijr_{ij}rij? 的精度参数。当cij=1c_{ij}=1cij?=1时,PMF的最大后验估计相当于传统的带正则化的矩阵分解,公式(2)。 在这里,精度参数 cijc_{ij}cij?作为评级 rijr_{ij}rij?的置信参数, cijc_{ij}cij?越大,越相信 rijr_{ij}rij?

rij=0r_{ij}=0rij?=0可以解释为两种方式:用户i对物品j不感兴趣,或者用户i不知道物品j。对于这种情况,文献[12]和[16]中, 作者介绍了不同评级rijr_{ij}rij?的不同置信参数cijc_{ij}cij?。 我们将使用相同的策略来设置 cijc_{ij}cij?
在这里插入图片描述
其中a和b是满足a>b>0的调优参数。

推荐矩阵分解有两个主要缺点:

  • 学习的潜在空间不容易解释
  • 不能处理冷启动问题

2.3 Probabilistic Topic Models

主题模型提供了文档的可解释的低维表示[8]。 LDA的生成过程如下:

在这里插入图片描述
主题比例是特定于文档的,但主题集由语料库共享。 LDA允许文档显示多个主题。 使用变分EM学习,此外,给定一个新的文档,我们可以使用变分推理将其内容定位在主题上。 我们的目标是使用主题建模来给出推荐系统中项目的基于内容的表示。

3. COLLABORATIVE TOPIC REGRESSION

将协作过滤和主题建模相结合的第一种方法是拟合一个模型,该模型使用潜在的主题空间来解释观察到的评级和观察到的单词。 例如,我们可以使用主题比例θj代替公式(3)中的潜在物品向量 vjv_jvj?
在这里插入图片描述

在这里插入图片描述
这个模型的局限性:它不能区分解释建议的主题和解释内容的重要主题。设想两篇文章具有相似的主题比例θA和θB,现在进一步假设这些文章对不同类型的用户感兴趣。 然而,使用公式(5)的主题比例可能会对这两类用户提出类似的建议。 协作主题回归可以检测到这种差异—一种类型的用户喜欢第一篇文章,另一种类型喜欢第二篇文章。

CTR还包括一个潜在变量 ?j\epsilon_j?j?,它可以在建模用户评级时抵消主题比例θj。 这个偏移变量可以解释。 预测的多少依赖于内容, 它对其他用户的依赖程度取决于有多少用户对文章进行了评级。(??)
在这里插入图片描述
β\betaβ代表K个主题,CTR的生成过程如下:

在这里插入图片描述在这里插入图片描述
CTR中的关键属性在于如何生成项潜向量vj。

在这里插入图片描述
称为协同主题回归的原因:

在这里插入图片描述
我们开发了一种EM样式算法来学习最大后验(MAP)估计。 后验最大化等价于在给定λu、λv和β的情况下,最大化U、V、θ1:J和R的完全对数似然。
在这里插入图片描述
对于 uiu_iui?vjv_jvj?,求梯度:
在这里插入图片描述
给定U和V,我们现在描述如何学习主题比例θj:
在这里插入图片描述
对β的优化:

在这里插入图片描述
预测新文章时,偏移量 ?=0\epsilon=0?=0,使用主题比例θj代替潜向量Vj。

https://wenku.baidu.com/view/df54937468eae009581b6bd97f1922791688bedd.html

  相关解决方案