当前位置: 代码迷 >> 综合 >> 用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布
  详细解决方案

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布

热度:59   发布时间:2023-12-15 05:58:44.0

传送门:用 Seaborn 做数据可视化(0)总章

目录:可视化数据集的数据分布

    • 1. 可视化单变量分布:distplot()
    • 2. 可视化二元分布:jointplot()
      • 2.1 散点图分布:jointplot() (默认 Kind=“scatter” )
      • 2.2 核密度分布:jointplot(kind="kde" )
      • 2.3 六边形分布: jointplot(kind="hex")
    • 3. 成对关系: 矩阵图:pairplot()

注意:这里的 distplot()、jointplot()、pairplot() 是高级的函数,很多简单的图像也可以直接借助 sns.hist()、sns. kdeplot();plt.scatter()、plt.hexbin()等函数直接进行绘图。

1. 可视化单变量分布:distplot()

distplot() 将频次直方图和 KDE 结合起来(默认绘制直方图并拟合 KDE )

x = np.random.normal(size=100)
sns.distplot(x);

在这里插入图片描述
参数 kde=False,rug=True:不画 KDE

sns.distplot(x, kde=False, rug=True);
# 或者直接使用 rugplot() 函数

在这里插入图片描述当然如开头所说,,也可以直接使用 sns.hist()、sns. kdeplot() 来单独绘制频次直方图和核密度图。

2. 可视化二元分布:jointplot()

jointplot()
可视化双变量分布(二元分布),可以同时看到两个变量的联合分布与单变量的独立分布

2.1 散点图分布:jointplot() (默认 Kind=“scatter” )

mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
sns.jointplot(x="x", y="y", data=df);

在这里插入图片描述

2.2 核密度分布:jointplot(kind=“kde” )

sns.jointplot(x="x", y="y", data=df, kind="kde");

在这里插入图片描述同理,入开头所说,,也可以直接使用 plt.scatter()、sns.kdeplot() 来分别绘制散点图、核密度图。

2.3 六边形分布: jointplot(kind=“hex”)

参数 kind=“hex” ,使用六边形块代替频次直方图

# 传递参数 kind= 'hex'
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):sns.jointplot(x=x, y=y, kind="hex", color="k");

在这里插入图片描述也可以使用 plt.hexbin()来单独绘制。

3. 成对关系: 矩阵图:pairplot()

pairplot() 矩阵图用来可视化数据集中的成对关系

iris = sns.load_dataset("iris")
sns.pairplot(iris);

在这里插入图片描述

  相关解决方案