我有一个data.frame,我正在尝试创建一个频率表,显示每行的值的频率.所以我从这样的事情开始:
d <- data.frame(a=c(1,2,3), b=c(3,4,5), c=c(1,2,5))
Run Code Online (Sandbox Code Playgroud)
看起来像这样:
a b c
1 3 1
2 4 2
3 5 5
Run Code Online (Sandbox Code Playgroud)
我真正想要创建的是一个应急数据框架或矩阵,如下所示:
1, 2, 3, 4, 5, 6, 7, 8, 9
2, 0, 1, 0, 0, 0, 0, 0, 0
0, 2, 0, 1, 0, 0, 0, 0, 0
0, 0, 1, 0, 2, 0, 0, 0, 0
Run Code Online (Sandbox Code Playgroud)
顶行只是一个标签行,不需要在最终结果中.但我在那里添加它是为了说明.每行显示数字1:9以及每个数字在起始数据的每一行中显示的次数.
我不能用一种简单的方法来创造这个.虽然看起来这个table()功能应该有所帮助,但我无法让它给我任何爱.任何帮助或想法都表示赞赏.
Jos*_*ien 12
干得好:
t(apply(d, 1, tabulate, nbin=9))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,] 2 0 1 0 0 0 0 0 0
[2,] 0 2 0 1 0 0 0 0 0
[3,] 0 0 1 0 2 0 0 0 0
Run Code Online (Sandbox Code Playgroud)
(虽然在这个应用程序中它可能无关紧要tabulate()(在代码中使用table())对于它执行计算的令人印象深刻的速度也很好.)
编辑:tabulate()未设置为处理0或负整数.如果你想要另一个衬里,你可以使用table(),做这样的事情:
d <- data.frame(a=c(0,-1,-2), b=c(3,4,5), c=c(1,2,5))
t(apply(d, 1, function(X) table(c(X, -9:9)) - 1))
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9
[1,] 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0
[2,] 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0
[3,] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 2 0 0 0 0
Run Code Online (Sandbox Code Playgroud)
使用表格的另一个解
library(reshape)
d <- data.frame(a=c(1,2,3), b=c(3,4,5), c=c(1,2,5))
d2 <- melt(d)
d2$rows <- rep(1:nrow(d), ncol(d))
table(d2$rows, d2$value)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4762 次 |
| 最近记录: |