是否有一种特定的方法来组合R中的data.tables列表?
我有一个~20个data.tables的列表,每个都有大约100万行,并希望将它们组合成一个包含2000万行的data.table.
我一直在这样做
Reduce('rbind', data.table)
Run Code Online (Sandbox Code Playgroud)
但它需要一段时间.
TNX!
有没有一种快速的方法来查找矩阵A中哪些行存在于矩阵B中?例如
m1 = matrix(c(1:6), ncol=2, byrow = T); m2 = matrix(c(1:4), ncol=2, byrow=T);
Run Code Online (Sandbox Code Playgroud)
结果将是1,2.
矩阵没有相同的行数(列数相同),并且它们有点大 - 从10 ^ 6 - 10 ^ 7行数.
我现在知道的最快的方法是:
duplicated(rbind(m1, m2))
Run Code Online (Sandbox Code Playgroud)
TNX!
我有一个嵌套的 data.frames 列表,获取所有 data.frames 的列名的最简单方法是什么?
例子:
d = data.frame(a = 1:3, b = 1:3, c = 1:3)
l = list(a = d, list(b = d, c = d))
Run Code Online (Sandbox Code Playgroud)
结果:
$a
[1] "a" "b" "c"
$b
[1] "a" "b" "c"
$c
[1] "a" "b" "c"
Run Code Online (Sandbox Code Playgroud) 使用以下模拟时间序列:
n=70
m1 = matrix(rnorm(n), ncol=7)
m2 = matrix(rnorm(n, 0,4), ncol=7)
d = data.frame(rbind(m1,m2), cl=rep(c(1,2), each=5))
Run Code Online (Sandbox Code Playgroud)
(前7列代表时间点,最后一列代表该类)
是否可以使用ggplot2构建包含每个图中平均曲线的分面时间序列?
结果应如下所示:
尝试在本地 Linux 计算机上使用 jar 时,出现以下错误:库初始化失败 - 无法分配文件描述符表 - 内存不足
机器有32G内存
如果需要,我可以提供更多信息。
任何帮助,将不胜感激。
r ×5
data.table ×1
dataframe ×1
ggplot2 ×1
java ×1
linux ×1
matrix ×1
nested ×1
time-series ×1