hist()函数被定义为一种从数据集中了解某些数值变量分布的快速方法。它将数字变量中的值划分为” bins”。它计算落入每个分类箱中的检查次数。这些容器负责通过可视化容器来快速直观地了解变量中值的分布。
我们可以使用DataFrame.hist()方法创建直方图, 该方法是matplotlib pyplot API的包装器。
它也是快速访问概率分布的有用工具。
DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None,ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)
示例:
import pandas as pd
info = pd.DataFrame({
'length': [2, 1.7, 3.6, 2.4, 1], 'width': [4.2, 2.6, 1.6, 5.1, 2.9]
})
hist = info.hist(bins=4)