因为有一部分的区域占比很小,画图时紧贴在一起,所以会造成重叠。
- 博主经过计算后的Series 是有序的,会出现最后一部分完全重叠。
如:
- 可以使用sample 方法随机取样,不过仍然有可能造成重叠。
如:data = data.sample(frac=1)
- 最有效的办法避免重叠就是将数据按照一个大小间隔排序。
如:
元数据为:1 2 3 4 5 6 7 8 9
排序后为:1 9 3 8 7 6 5 4 2
排序代码:
print(data_sort)
length = len(data_sort.values)
indexs = [str(x) for x in data_sort.index]
for i, j in zip(range(0, length, 2), range(length-1, 0, -2)):if j <= i:breakdata_sort.iloc[i],data_sort.iloc[j] = data_sort.iloc[j],data_sort.iloc[i]indexs[i], indexs[j] = indexs[j], indexs[i]data_sort = pd.Series(data_sort.values, index=indexs)
print(data_sort)
结果:
[50, 60) 5117
[40, 50) 2971
[30, 40) 1152
[60, 70) 659
[20, 30) 47
[80, 90) 32
[70, 80) 16
[90, 100) 6
Name: size, dtype: int64
[90, 100) 6
[40, 50) 2971
[80, 90) 32
[60, 70) 659
[20, 30) 47
[30, 40) 1152
[70, 80) 16
[50, 60) 5117
dtype: int64