我有关于客户和他们购买的不同产品的数据:
Customer Product
1 A
1 B
1 C
2 D
2 E
2 F
3 A
3 B
3 D
4 A
4 B
Run Code Online (Sandbox Code Playgroud)
我想检查哪些产品在不同客户中同时出现。我想获得不同长度的产品组合的数量。例如,产品组合 A 和 B 一起出现在三个不同的客户身上;产品组 A、B 和 C 出现在一个客户身上。对数据中所有 2 个或更多产品的所有不同集合,依此类推。就像是:
Product Group Number
A, B, C 1
D, E, F 1
A, B, D 1
A, B 3
Run Code Online (Sandbox Code Playgroud)
因此,我正在计算只有产品 A 和 B 的客户(例如客户 4)以及有A 和 B 的客户以及任何其他产品(例如客户 1,他们有 A、B)中的 A、B 组合和 C)。
有没有人有任何想法如何使用 atidyverse或baseR 方法来做到这一点?我觉得这应该是微不足道的 - 也许 …
假设我有一个函数名列表的tibble(或数据框,无论如何).让我们说,像:
functions <- tibble(c("log()", "log10()", "sqrt()"))
Run Code Online (Sandbox Code Playgroud)
我希望能够将数据集传递给由index选择的其中一个函数.例如,我可能想要做类似的事情:
data %>% functions[[1]]
Run Code Online (Sandbox Code Playgroud)
但我似乎无法让它发挥作用.我对管道很新,但我很确定这很容易,即使无法使用它!等等
提前致谢.