错误原因
train_sizes, train_scores, test_scores = learning_curve(estimator, X, y, cv=cv, n_jobs=n_jobs, train_sizes=train_sizes, verbose=verbose) #请注意X,y
解决方法:
from sklearn.utils import shuffleX_shuffle, y_shuffle = shuffle(X, y)
错误说明:
这是因为在未shuffle(洗牌)之前,如果做了CV导致可能出现数据集中只有一个class。而shuffle过后,打乱了数据,减小了上述情况的可能性(也就是说如果数据集极度不均衡,即使shuffle过后仍然可能跳出上述的bug)