小编Win*_*erZ的帖子

Python生成滚动窗口来计算相关性

我有一个大熊猫数据框(97165 行和 2 列),我想计算并保存每 100 行这些列之间的相关性,我想要这样的东西:

第一个相关性 --> 从 0 到 100 的行 --> corr = 0.265

第二个相关性 --> 从 1 到 101 的行 --> corr = 0.279

第三个相关性 --> 从 2 到 102 的行 --> corr = 0.287

每个值都必须存储,然后在图中显示,所以我必须将所有这些值保存在列表或类似的东西中。

我一直在阅读与滚动窗口熊猫滚动窗口相关的熊猫文档, 但我无法实现任何目标。我试图生成一个简单的循环来获得一些结果,但我遇到了内存问题,我尝试过的代码是:

lcl = 100
a = []
for i in range(len(tabla)):

    x = tabla.iloc[i:lcl, [0]] 
    y = tabla.iloc[i:lcl, [1]]
    z = x['2015_Avion'].corr(y['2015_Hotel'])
    a.append(z) 
    lcl += 1
Run Code Online (Sandbox Code Playgroud)

有什么建议?

python numpy pandas

4
推荐指数
1
解决办法
2430
查看次数

标签 统计

numpy ×1

pandas ×1

python ×1