当前位置: 代码迷 >> python >> 功能工具分类处理 编辑
  详细解决方案

功能工具分类处理 编辑

热度:111   发布时间:2023-07-16 09:36:53.0

Featuretools提供了处理分类变量的集成功能

 variable_types={"product_id": ft.variable_types.Categorical} https://docs.featuretools.com/loading_data/using_entitysets.html 

但是,这些是strings还是pandas.Category类型,以便与pandas.Category实现最佳兼容性?

编辑

此外,是否需要手动指定所有列,如否则将从拟合pandas数据类型自动推断它们

import featuretools.variable_types as vtypes
variable_types = {'gender': vtypes.Categorical,
                  'patient_id': vtypes.Categorical,
                  'age': vtypes.Ordinal,
                  'scholarship': vtypes.Boolean,
                  'hypertension': vtypes.Boolean,
                  'diabetes': vtypes.Boolean,
                  'alcoholism': vtypes.Boolean,
                  'handicap': vtypes.Boolean,
                  'no_show': vtypes.Boolean,
                  'sms_received': vtypes.Boolean}

将数据加载到Featuretools时,应使用Pandas Category dtype。 与使用字符串相比,这将大大节省内存使用量。

加载数据时,无需手动指定每种变量类型。 如果没有提供,Featuretools将尝试从Pandas dtype推断它。

  相关解决方案