这是我的代码:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv('death_regression2.csv')
data3 = data.replace(r'\s+', np.nan, regex = True)
plt.figure(figsize=(90,90))
corr = data3.corr()
print(np.shape(list(corr)))
print(np.shape(data3))
Run Code Online (Sandbox Code Playgroud)
(135,) (4909, 204)
所以在我使用相关函数之前,参数的总数是 204(列数),但是在使用 data3.corr() 之后,一些参数丢失了,减少到 135。
如何检查数据中所有列之间的相关性?