当前位置: 代码迷 >> 综合 >> 特征工程(part5)--分类型变量
  详细解决方案

特征工程(part5)--分类型变量

热度:89   发布时间:2024-02-23 09:02:15.0

学习笔记,仅供参考,有错必究


文章目录

    • 分类型变量
      • 分类型变量的编码
        • one-hot编码
        • 虚拟编码
        • 效果编码
        • 各种分类变量编码的优缺点


分类型变量


分类型变量的编码


分类变量中的类别通常不是数值型,我们需要一种编码方式将非数值型的类别转换为数值,一般,我们很容易想到,简单地为k个可能类别中的每个类别分配一个整数,比如从1到k,但这样会使类别彼此之间存在顺序,这在分类变量中是不被允许的。


one-hot编码



虚拟编码