我有一个包含 20,000 行和 300 列的数组。每个元素都是一个整数。我想计算这个矩阵中每个整数的出现次数。
我已经尝试过以下方法:
>frequency_Table=read.csv('huge_file.csv',header=FALSE,check.names=FALSE)
>table(frequency_Table)
Run Code Online (Sandbox Code Playgroud)
我收到错误“尝试制作包含 >= 2^31 元素的表格”,阅读后这是有道理的。
我想要这样的东西:
1 2000
2 2023
3 5683
Run Code Online (Sandbox Code Playgroud)
基本上,这是所有数字的频率表。任何意见,将不胜感激!
“频率表”对象是一个data.frame. 我们unlist(假设OP想要一个R解决方案,因为数据集是用R语法读取的)它创建一个vector,然后使用table
as.data.frame(table(unlist(frequency_table)))
Run Code Online (Sandbox Code Playgroud)
set.seed(24)
frequency_table <- as.data.frame(matrix(sample(22:29, 20*4,
replace=TRUE), ncol=4))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3380 次 |
| 最近记录: |