Vai*_*ngh 0 compare r summary dataframe
我有两个数据框 A 和 B,除了主键之外,两个数据框都具有相同的列(在实际数据中,我有超过 50 个这样的列),现在我想比较“摘要”统计数据(正常的 R 摘要()命令)两个数据框,但为了比较的目的,我希望看到它们彼此相邻,如所附图像中所示。

数据帧输出结构
structure(list(Pkey = c(1, 2, 3, 4, 5), Phy_marks = c(43, 44, 45,
46, 47), Math_marks = c(34, 34, 45, 32, 21)), .Names = c("Pkey",
"Phy_marks", "Math_marks"), row.names = c(NA, -5L), class =
"data.frame")
structure(list(Pkey = c(11, 12, 13, 14, 15), Phy_marks = c(43, 44,
45, 46, 47), Math_marks = c(34, 34, 45, 32, 21)), .Names = c("Pkey",
"Phy_marks", "Math_marks"), row.names = c(NA, -5L), class =
"data.frame")
Run Code Online (Sandbox Code Playgroud)
请帮忙!!!
您可以利用我在下面创建的函数来比较两个数据集。
library(dplyr)
compare_them <- function(data1,data2) {
sum1 <- apply(data1,2,summary) %>% data.frame()
sum2 <- apply(data2,2,summary) %>% data.frame()
names(sum1) <- paste0(names(sum1),"1")
names(sum2) <- paste0(names(sum2),"2")
final <- cbind(sum1,sum2)
final1 <- t(final)
final2 <- final1[order(row.names(final1)), ]
final_1 <- t(final2) %>% data.frame()
final_1
}
compare_them(mtcars,mtcars*2) %>% View()
Run Code Online (Sandbox Code Playgroud)
data1 变量末尾为“1”,data2 变量末尾为“2”。我以 mtcars 和 mtcars*2 为例。最终结果如下所示。
