我正在尝试使用dplyr和purrr整理来自模拟研究的结果.我的结果保存为数据框列表,其中包含几种不同分类算法的结果,我正在尝试使用purrr和dplyr来总结这些结果.
我正在尝试计算 - 分配给每个群集的对象数量 - 群集中实际属于群集的对象数量 - 使用3种不同算法的真阳性,误报,假阴性和真阴性的数量(KEEP1 - KEEP3 ) - 对于2个算法,我可以访问群集中的概率,因此我可以将其与alpha的替代选择进行比较 - 因此我可以使用不同的alpha选择来计算真阳性等.
我发现了这个:https://github.com/tidyverse/dplyr/issues/3101,我在列表的单个元素上成功使用,以获得我想要的内容:
f <- function(.x, .y) {
sum(.x & .y)
}
actions <- list(
.vars = lst(
c('correct'),
c('KEEP1', 'KEEP2', 'KEEP3'),
c('pval1', 'pval2')
),
.funs = lst(
funs(Nk = length, N_correct = sum),
funs(
TP1 = f(., .y = correct),
FN1 = f(!(.), .y = correct),
TN1 = f(!(.), .y = !(correct)),
FP1 = f(., .y = !(correct))
),
funs(
TP2 = …Run Code Online (Sandbox Code Playgroud)