我对findCorrelation()R的CARET软件包的功能有一些疑问。
当我使用此代码时:
correlations <- cor(list)
highCorr <- findCorrelation(correlations, cutoff = .6, names = FALSE)
new_list <- list[, -highCorr]
Run Code Online (Sandbox Code Playgroud)
- 它会删除0.6以上和-0.6以下的所有功能吗?
如果您要问的是是否将两个变量之间大于0.6的成对相关性与小于-0.6的成对相关性相同,那么答案是肯定的。从文档中:“考虑了成对相关的绝对值。”
- 如果函数相互关联,该函数如何选择要删除的一个?
再次从文档中得出:“该函数查看每个变量的平均绝对相关性,并删除具有最大平均绝对相关性的变量。” 因此,换句话说,它基于与所有其他变量之间的相关性来选择两个变量之一。
请参阅help(findCorrelation)以获取更多信息。