Excel 中的分箱

Shr*_*eya 5 excel worksheet-function

MS Excel 中的哪些公式可以用于 -

等深度分箱
等宽度分箱

小智 6

这是我用过的。我分箱的数据位于A2:A2001.

等宽:

U2我使用以下公式计算了单独单元格 ( ) 中的宽度:

=(MAX($A$2:$A$2001) - MIN($A$2:$A$2001) + 0.00000001)/10

10是垃圾箱的数量。之所以+ 0.00000000001存在,是因为没有它,等于最大值的值就会被放入自己的容器中。

然后,对于实际的分箱,我使用了这个:

=ROUNDDOWN(($A2-MIN($A$2:$A$2001))/$U$2, 0)

此函数通过将(值 - 最小值)除以 bin 宽度来查找高于最小值的 bin 宽度。我们只关心有多少个完整的 bin 宽度适合该值,而不是小数部分,因此我们用来ROUNDDOWN截断所有小数 bin 宽度(即显示0小数位)。

等深度

这个就比较简单了。

=ROUNDDOWN(PERCENTRANK($A$2:$A$2001, $A2)*10, 0)

$A2首先,从所有被分箱的单元格( ) 中获取当前单元格 ( ) 的百分位数排名$A$2:$A$2001。这将是一个介于 0 和 1 之间的值,因此要将其转换为 bin,只需乘以所需的 bin 总数(我使用的10)。然后,按照以前的方法去掉小数。

对于其中任何一个,如果您希望 bin 从 1 而不是 0 开始,只需+1在公式末尾添加 a 即可。


mom*_*obo 0

您可能必须构建矩阵才能绘制图表。

对于箱支架,您可以使用等深度和等宽度的=PERCENTILE()差异比例。=Max(Data) - Min(Data)

您可以使用 获得频率=COUNTIF()。bin 的平均值可以使用以下方式获得=SUMPRODUCT((Data>LOWER_BRACKET)*(Data<UPPER_BRACKET)*Data)/frequency

可以使用 SUMPRODUCT 和/或数组公式来获得更复杂的统计数据(我不推荐这样做,因为对于非程序员来说很难理解)