我有以下数据框,显示哪些案例是相互关联的:
DebtorId DupDebtorId
1: 1 2
2: 1 3
3: 1 4
4: 5 1
5: 5 2
6: 5 3
7: 6 7
8: 7 6
Run Code Online (Sandbox Code Playgroud)
我的目标是为每组案例分配一个唯一的组 ID。期望的输出是:
DebtorId group
1: 1 1
2: 2 1
3: 3 1
4: 4 1
5: 5 1
6: 6 2
7: 7 2
Run Code Online (Sandbox Code Playgroud)
我的思路:
library(data.table)
example <- data.table(
DebtorId = c(1,1,1,5,5,5,6,7),
DupDebtorId = c(2,3,4,1,2,3,7,6)
)
unique_pairs <- example[!duplicated(t(apply(example, 1, sort))),] #get unique pairs of DebtorID and DupDebtorID
unique_pairs[, group := .GRP, …Run Code Online (Sandbox Code Playgroud) 有没有办法可以提取 R 中数值的第一个非零数字?
示例输入:
123.01, 0.56, 0.078, 0.0092
Run Code Online (Sandbox Code Playgroud)
输出:
1, 5, 7, 9
Run Code Online (Sandbox Code Playgroud)