小编Res_her的帖子

如何识别组内最常见的值组合？

我有一个表，其中每一行代表一名学生在一门课程中的注册情况，与此类似，但要大得多：

学生	课程
001	PSYC101
001	化学102
002	PSYC101
002	斯潘101
002	生物101
003	生物101
003	英语201
003	欣德101
003	化学102
004	PSYC101
004	化学102
004	欣德101

我想知道学生最常一起修读哪些课程组合。我从 2 道菜组合开始，但也可能想看看 3 道菜组合。

我完全不知道这个程序的名称。

我发现这个使用该dplyr包的类似示例：/sf/ask/4312923471/

但是，我不认为这正是我想要的。当某些学生修读了 2 门以上课程时，我想要所有可能的 2 门课程组合。例如，对于学生 3，他们将具有以下内容：

BIO101 和 ENG201
BIO101 & HIND101
生物101 & 化学102
ENG201 和 HIND101
ENG201 和 CHEM102
HIND101 和 CHEM102

然后，我会找到所有学生中最常见的组合。

6
推荐指数

2
解决办法

188
查看次数

标签统计

combinations ×1

r ×1