小编use*_*111的帖子

合并data.tables列表

是否有一种特定的方法来组合R中的data.tables列表?

我有一个~20个data.tables的列表,每个都有大约100万行,并希望将它们组合成一个包含2000万行的data.table.

我一直在这样做

Reduce('rbind', data.table)
Run Code Online (Sandbox Code Playgroud)

但它需要一段时间.

TNX!

r data.table

23
推荐指数
2
解决办法
1万
查看次数

比较两个矩阵之间的行

有没有一种快速的方法来查找矩阵A中哪些行存在于矩阵B中?例如

m1 = matrix(c(1:6), ncol=2, byrow = T); m2 = matrix(c(1:4), ncol=2, byrow=T);
Run Code Online (Sandbox Code Playgroud)

结果将是1,2.

矩阵没有相同的行数(列数相同),并且它们有点大 - 从10 ^ 6 - 10 ^ 7行数.

我现在知道的最快的方法是:

duplicated(rbind(m1, m2))
Run Code Online (Sandbox Code Playgroud)

TNX!

r matrix

13
推荐指数
1
解决办法
6865
查看次数

从 data.frames 的嵌套列表中提取列名

我有一个嵌套的 data.frames 列表,获取所有 data.frames 的列名的最简单方法是什么?

例子:

d = data.frame(a = 1:3, b = 1:3, c = 1:3)

l = list(a = d, list(b = d, c = d))
Run Code Online (Sandbox Code Playgroud)

结果:

$a
[1] "a" "b" "c"

$b
[1] "a" "b" "c"

$c
[1] "a" "b" "c"
Run Code Online (Sandbox Code Playgroud)

nested r dataframe

12
推荐指数
2
解决办法
562
查看次数

R中的快速采样

有没有比base::sample函数更快的方法来获取随机子样本(没有替换)?

r

10
推荐指数
1
解决办法
1855
查看次数

在ggplot2中具有平均轮廓的刻面时间序列

使用以下模拟时间序列:

n=70
m1 = matrix(rnorm(n), ncol=7)
m2 = matrix(rnorm(n, 0,4), ncol=7)
d = data.frame(rbind(m1,m2), cl=rep(c(1,2), each=5))
Run Code Online (Sandbox Code Playgroud)

(前7列代表时间点,最后一列代表该类)

是否可以使用ggplot2构建包含每个图中平均曲线的分面时间序列?

结果应如下所示:绘制平均曲线

r time-series ggplot2

6
推荐指数
1
解决办法
786
查看次数

jar 执行时出错 - 无法分配文件描述符表

尝试在本地 Linux 计算机上使用 jar 时,出现以下错误:库初始化失败 - 无法分配文件描述符表 - 内存不足

机器有32G内存

如果需要,我可以提供更多信息。

任何帮助,将不胜感激。

java linux

6
推荐指数
1
解决办法
7061
查看次数

标签 统计

r ×5

data.table ×1

dataframe ×1

ggplot2 ×1

java ×1

linux ×1

matrix ×1

nested ×1

time-series ×1