使用check_correlation加速大熊猫分析分析?

OCT*_*IAN 6 python pandas pandas-profiling

使用熊猫分析生成报告。数据集的大小非常大,以加快处理速度,试图关闭相关性,因此我使用了另一篇我看到的Check_correlations,ValueError:配置参数“ check_correlation”不存在。那是我从使用此行得到的问题

a = prof.ProfileReport(df, title='EXTRACTS', check_correlation=False)
Run Code Online (Sandbox Code Playgroud)

产生这个问题

ValueError:配置参数“ check_correlation”不存在。

Lev*_*ent 4

由于他们更改了版本 2 上的配置,您可以将其用作:

import pandas_profiling

profile = df.profile_report(check_correlation_pearson=False,
correlations={'pearson': False,
'spearman': False,
'kendall': False,
'phi_k': False,
'cramers': False,
'recoded': False})
Run Code Online (Sandbox Code Playgroud)

关闭相关性。不过,它仍然不如 1.4 版本快。您还可以在此处研究其他配置。