我有一个大熊猫数据框(97165 行和 2 列),我想计算并保存每 100 行这些列之间的相关性,我想要这样的东西:
第一个相关性 --> 从 0 到 100 的行 --> corr = 0.265
第二个相关性 --> 从 1 到 101 的行 --> corr = 0.279
第三个相关性 --> 从 2 到 102 的行 --> corr = 0.287
每个值都必须存储,然后在图中显示,所以我必须将所有这些值保存在列表或类似的东西中。
我一直在阅读与滚动窗口熊猫滚动窗口相关的熊猫文档, 但我无法实现任何目标。我试图生成一个简单的循环来获得一些结果,但我遇到了内存问题,我尝试过的代码是:
lcl = 100
a = []
for i in range(len(tabla)):
x = tabla.iloc[i:lcl, [0]]
y = tabla.iloc[i:lcl, [1]]
z = x['2015_Avion'].corr(y['2015_Hotel'])
a.append(z)
lcl += 1
Run Code Online (Sandbox Code Playgroud)
有什么建议?