1.lgb(lightgbm)处理类别特征遇到的问题:
ValueError: DataFrame.dtypes for data must be int, float or bool. Did
not expect the data types in the following fields: Sex, Embarked
加上这些代码,完美解决,记得点赞
from sklearn import preprocessing
encoder = preprocessing.LabelEncoder()
encoder.fit(list(X["Sex"].values))
X["Sex"]=encoder.transform(list(X["Sex"].values))
encoder.fit(list(X["Embarked"].values))
X["Embarked"]=encoder.transform(list(X["Embarked"].values))
2.注意函数预测时得到的不是0和1,需要自己划分区间。‘
y_gbm_pred[y_gbm_pred > .5] = 1
y_gbm_pred[y_gbm_pred <=.5] = 0
3,注意提取(pd.read_csv)时,会把所有列都提取,所以需要提取特定列。
这3个小问题卡的我这个新手一愣一愣的。