文章作者:Tyan
博客:noahsnail.com | CSDN | 简书
本文主要是演示scikit-learn自带的数据集的一些用法。本文介绍两种sklearn构建数据集的方式,一种是直接加载已有的数据集,另一种是通过工具构建一个数据集。
- Demo
import matplotlib.pyplot as pltfrom sklearn import datasets
from sklearn.linear_model import LinearRegression# 直接加载数据集
loaded_data = datasets.load_boston()
data_X = loaded_data.data
data_y = loaded_data.target# 定义模型
model = LinearRegression()
# 学习参数
model.fit(data_X, data_y)
# 计算预测值
result = model.predict(data_X)# 创造一些线性回归的数据点
X, y = datasets.make_regression(n_samples = 100, n_features = 1, n_targets = 1, noise = 5)
# 绘制创造的数据集的散点图
plt.scatter(X, y)
plt.show()
- 结果
[ 30.00821269 25.0298606 30.5702317 28.60814055]
[ 24. 21.6 34.7 33.4]
参考资料
- https://www.youtube.com/user/MorvanZhou