学习笔记,仅供参考,有错必究
文章目录
-
- 分类型变量
-
- 分类型变量的编码
-
- one-hot编码
- 虚拟编码
- 效果编码
- 各种分类变量编码的优缺点
分类型变量
分类型变量的编码
分类变量中的类别通常不是数值型,我们需要一种编码方式将非数值型的类别转换为数值,一般,我们很容易想到,简单地为k个可能类别中的每个类别分配一个整数,比如从1到k
,但这样会使类别彼此之间存在顺序,这在分类变量中是不被允许的。
学习笔记,仅供参考,有错必究
分类变量中的类别通常不是数值型,我们需要一种编码方式将非数值型的类别转换为数值,一般,我们很容易想到,简单地为k个可能类别中的每个类别分配一个整数,比如从1到k
,但这样会使类别彼此之间存在顺序,这在分类变量中是不被允许的。