我有一个包含六列的大型数据集(称为A,B,C,D,E,F),大约450,000行.我只是试图找到列之间的相关性A和B:
cor(A, B)
Run Code Online (Sandbox Code Playgroud)
我得到了
[1] NA
结果是.我该怎么做才能解决这个问题?
Ite*_*tor 13
试试cor(A,B, use = "pairwise.complete.obs").这将忽略观察中的NA.
要在统计上严格,您还应该查看数据中缺少的条目数,并查看随机假设中的缺失是否成立.
编辑1:?cor查看use参数的其他选项.