小提琴图
小提琴图显示了一个(或多个)变量在不同层次上的分布,这样就可以比较这些分布。小提琴图不同于箱式图,箱式图中所有的图成分对应于实际的数据点,小提琴图的特征是分布的核密度估计。我个人感觉小提琴图和箱式图要传递的信息比较类似,小提琴图适合样本量较大的时候,这样估计的概率分布会比较准确,箱式图在样本量小的时候,可以比较明确的看到每一个样本实际所处的位置。
代码部分
基于python的seaborn提供的一个小提琴图小demo
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd;
sns.set(style="whitegrid")
# 以下两句防止中文显示为窗格
plt.rcParams["font.sans-serif"]=["SimHei"]
plt.rcParams["axes.unicode_minus"] = False# 导入数据,从excel中df = pd.read_excel('fu.xlsx')# 设置窗口的大小
f, ax = plt.subplots(figsize=(11, 6))# 绘制小提琴图
sns.violinplot(data=df, palette="Set3", bw=.2, cut=1, linewidth=1)# 设置轴显示的范围
#ax.set(ylim=(-.7, 1.05))
# 去除上下左右的边框(默认该函数会取出右上的边框)
sns.despine(left=True, bottom=True)
plt.savefig('violin.png',dpi=150)