如何计算R中庞大数据集中两个变量的相关性?

vie*_*vee 6 r correlation

我有一个包含六列的大型数据集(称为A,B,C,D,E,F),大约450,000行.我只是试图找到列之间的相关性AB:

cor(A, B)
Run Code Online (Sandbox Code Playgroud)

我得到了

[1] NA

结果是.我该怎么做才能解决这个问题?

Ite*_*tor 13

试试cor(A,B, use = "pairwise.complete.obs").这将忽略观察中的NA.

要在统计上严格,您还应该查看数据中缺少的条目数,并查看随机假设中的缺失是否成立.

编辑1:?cor查看use参数的其他选项.