我正在收集R中包含3列的日志:
周,探测和观察次数.
没有观察时没有记录.
week=c(1,2,2,4)
probe=c("A","C","B","C")
obs=c(2,4,3,1)
logs=data.frame(week,probe,obs)
logs
week probe obs
1 A 2
2 C 4
2 B 3
4 C 1
Run Code Online (Sandbox Code Playgroud)
我想重新格式化数据,以便它包括所有星期和所有探测器,即使没有观察,所以它看起来像这样:
week probe obs
1 A 2
1 B 0
1 C 0
1 D 0
2 A 0
2 B 0
2 C 3
2 D 4
3 A 0
3 B 0
3 C 0
3 D 0
4 A 0
4 B 0
4 C 1
4 D 0
Run Code Online (Sandbox Code Playgroud)
我在这里列出了所有探测器:
allprobes=c("A","B","C","D")
Run Code Online (Sandbox Code Playgroud)
我想看看这几周:
allweeks=c(1:4)
Run Code Online (Sandbox Code Playgroud)
我一直在寻找融化,演员,重塑,但我只能设法每个ID或每月获得1行...因为我实际上想要保留原始格式的日志.起初看起来很容易,但我现在卡住了......关于如何以这种方式格式化数据的任何建议?
非常感谢您的帮助.
基础R中的两个选项:
expand.grid和merge:> fullFrame <- expand.grid(allweeks, allprobes)
> names(fullFrame) <- c("week", "probe")
> merge(fullFrame, logs, all = TRUE)
week probe obs
1 1 A 2
2 1 B NA
3 1 C NA
4 1 D NA
5 2 A NA
6 2 B 3
7 2 C 4
8 2 D NA
9 3 A NA
10 3 B NA
11 3 C NA
12 3 D NA
13 4 A NA
14 4 B NA
15 4 C 1
16 4 D NA
Run Code Online (Sandbox Code Playgroud)
expand.grid将创建data.frame"allprobes"和"allweeks"对象的所有可能组合.然后,我们重命名该新列的列data.frame以匹配data.frame使用时"日志"中的相关列merge.该参数all = TRUE告诉merge用以填充缺失值NA.
如果您想要零而不是NA,请按以下步骤操作:
fullFrame <- expand.grid(allweeks, allprobes)
names(fullFrame) <- c("week", "probe")
finalLogs <- merge(fullFrame, logs, all = TRUE)
finalLogs[is.na(finalLogs)] <- 0
Run Code Online (Sandbox Code Playgroud)
xtabs"周"和"探针"转换为因素后,如果您将"周"和"探测"转换为包含所有相关级别的因子,那么您可以简单地使用xtabs包装data.frame:
logs$week <- factor(logs$week, levels=c(1, 2, 3, 4))
logs$probe <- factor(logs$probe, levels=c("A", "B", "C", "D"))
data.frame(xtabs(obs ~ week + probe, logs))
# week probe Freq
# 1 1 A 2
# 2 2 A 0
# 3 3 A 0
# 4 4 A 0
# 5 1 B 0
# 6 2 B 3
# 7 3 B 0
# 8 4 B 0
# 9 1 C 0
# 10 2 C 4
# 11 3 C 0
# 12 4 C 1
# 13 1 D 0
# 14 2 D 0
# 15 3 D 0
# 16 4 D 0
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
163 次 |
| 最近记录: |