对于分组观察数据的频数,从而了解数据在不同区间的分布,我们可以创建数据桶。创建分为按照建议的区间长度进行划分,也可以自行设置参数。这里主要讲解自行设置参数,将最大值,最小值,步长设置好。对于频数的大小,一直不是很清楚,所以自己创建一个小数据集,研究了一下。tableau应该是按照左开右闭的规则统计频数的。
数据源:1.5 2 3 4 5 6.5 7 7.1 9 10
区间划分含义:
区间 | 包含的数字 | 频数 |
[1,2) | 1.5 | 1 |
[2,3) | 2 | 1 |
[3,4) | 3 | 1 |
[4,5) | 4 | 1 |
[5,6) | 5 | 1 |
[6,7) | 6.5 | 1 |
[7,8) | 7 7.1 | 2 |
[8,9) | 没有 | 0 |
[9,10) | 9 | 1 |
[10,11) | 10 | 1 |
当把步长参数设置为5时,tableau自动调整了数据的起始位置,变为从0开始了。因为这样才能刚好0~5,5~10,10~15,区间划分更好看。
区间划分含义:
区间 | 包含的数字 | 频数 |
[0,5) | 1.5 2 3 4 | 4 |
[5,10) | 5 6.5 7 7.1 9 | 5 |
[10,15) | 10 | 1 |