当前位置: 代码迷 >> 综合 >> lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):
  详细解决方案

lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):

热度:8   发布时间:2023-11-26 15:23:20.0

1.lgb(lightgbm)处理类别特征遇到的问题:

ValueError: DataFrame.dtypes for data must be int, float or bool. Did
not expect the data types in the following fields: Sex, Embarked

加上这些代码,完美解决,记得点赞

from sklearn import preprocessing
encoder = preprocessing.LabelEncoder()
encoder.fit(list(X["Sex"].values))
X["Sex"]=encoder.transform(list(X["Sex"].values))
encoder.fit(list(X["Embarked"].values))
X["Embarked"]=encoder.transform(list(X["Embarked"].values))

2.注意函数预测时得到的不是0和1,需要自己划分区间。‘
在这里插入图片描述

y_gbm_pred[y_gbm_pred > .5] = 1
y_gbm_pred[y_gbm_pred <=.5] = 0

在这里插入图片描述
3,注意提取(pd.read_csv)时,会把所有列都提取,所以需要提取特定列。

这3个小问题卡的我这个新手一愣一愣的。