当前位置: 代码迷 >> 综合 >> 生成模型与判别模型 | 15mins 入门 | 《统计学习方法》学习笔记(七)
  详细解决方案

生成模型与判别模型 | 15mins 入门 | 《统计学习方法》学习笔记(七)

热度:83   发布时间:2023-12-21 14:18:23.0

生成模型与判别模型

监督学习任务:学习一个模型,应用这个模型,对给定的输入预测相应的输出。

模型形式:

  1. 决策函数: Y = f ( X ) Y = f(X) Y=f(X)
  2. 条件概率分布: P ( Y ∣ X ) P(Y|X) P(YX)

学习方法:

  1. 生成方法(generative approach)

    由数据学习联合概率分布 P ( X , Y ) P(X,Y) P(X,Y),然后求出条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX)作为预测的模型,即生成模型:
    P ( Y ∣ X ) = P ( X , Y ) P ( X ) P(Y|X)=\frac{P(X,Y)}{P(X)} P(YX)=P(X)P(X,Y)?
    这样的方法称为生成方法,因为模型表示了给定输入X产生输出Y的生成关系。

  2. 判别方法(discriminative approach)

    由数据直接学习决策函数 f ( X ) f(X) f(X)或者条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX)作为预测的模型,即判别模型,判别方法关心的是对给定的输入X,应该预测什么样的输出Y。

学到的模型:

  1. 生成模型(generative model):朴素贝叶斯法和隐马尔可夫模型
  2. 判别模型(discriminative model) :k近邻法、感知机、决策树、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法和条件随机场

生成方法特点:

  • 生成方法可以还原出联合概率分布 P ( X , Y ) P(X,Y) P(X,Y),而判别方法则不能
  • 生成方法的学习收敛速度更快,即当样本容量增加的时候,学到的模型可以更快地收敛于真实模型
  • 当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用

判别方法特点:

  • 判别方法直接学习的是条件概率 P ( Y ∣ X ) P(Y|X) P(YX)或决策函数 f ( X ) f(X) f(X),直接面对预测,往往学习的准确率更高
  • 由于直接学习 P ( Y ∣ X ) P(Y|X) P(YX) f ( X ) f(X) f(X),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。
  相关解决方案