传送门:用 Seaborn 做数据可视化(0)总章
目录:可视化数据集的数据分布
-
- 1. 可视化单变量分布:distplot()
- 2. 可视化二元分布:jointplot()
-
- 2.1 散点图分布:jointplot() (默认 Kind=“scatter” )
- 2.2 核密度分布:jointplot(kind="kde" )
- 2.3 六边形分布: jointplot(kind="hex")
- 3. 成对关系: 矩阵图:pairplot()
注意:这里的 distplot()、jointplot()、pairplot() 是高级的函数,很多简单的图像也可以直接借助 sns.hist()、sns. kdeplot();plt.scatter()、plt.hexbin()等函数直接进行绘图。
1. 可视化单变量分布:distplot()
distplot() 将频次直方图和 KDE 结合起来(默认绘制直方图并拟合 KDE )
x = np.random.normal(size=100)
sns.distplot(x);
参数 kde=False,rug=True:不画 KDE
sns.distplot(x, kde=False, rug=True);
# 或者直接使用 rugplot() 函数
当然如开头所说,,也可以直接使用 sns.hist()、sns. kdeplot() 来单独绘制频次直方图和核密度图。
2. 可视化二元分布:jointplot()
jointplot() :
可视化双变量分布(二元分布),可以同时看到两个变量的联合分布与单变量的独立分布
2.1 散点图分布:jointplot() (默认 Kind=“scatter” )
mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
sns.jointplot(x="x", y="y", data=df);
2.2 核密度分布:jointplot(kind=“kde” )
sns.jointplot(x="x", y="y", data=df, kind="kde");
同理,入开头所说,,也可以直接使用 plt.scatter()、sns.kdeplot() 来分别绘制散点图、核密度图。
2.3 六边形分布: jointplot(kind=“hex”)
参数 kind=“hex” ,使用六边形块代替频次直方图
# 传递参数 kind= 'hex'
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):sns.jointplot(x=x, y=y, kind="hex", color="k");
也可以使用 plt.hexbin()来单独绘制。
3. 成对关系: 矩阵图:pairplot()
pairplot() 矩阵图用来可视化数据集中的成对关系
iris = sns.load_dataset("iris")
sns.pairplot(iris);