我有一个数据框,每行包含大约 500 个产品类别的总销售额。所以我的数据框中有 500 列。我试图找到与另一个数据框列相关性最高的类别。所以我将使用皮尔逊相关法。但所有类别的总销售额都是高度倾斜的数据,所有类别列的倾斜程度在 10 到 40 之间。所以我想使用 boxcox 转换来记录转换此销售数据。由于我的销售数据也有 0 值,因此我想使用 boxcox1p 函数。有人可以帮助我,如何计算 boxcox1p 函数的 lambda,因为它是该函数的强制参数?另外,这是我的问题陈述找到高度相关类别的正确方法吗?