我有一个表,其中每一行代表一名学生在一门课程中的注册情况,与此类似,但要大得多:
| 学生 | 课程 |
|---|---|
| 001 | PSYC101 |
| 001 | 化学102 |
| 002 | PSYC101 |
| 002 | 斯潘101 |
| 002 | 生物101 |
| 003 | 生物101 |
| 003 | 英语201 |
| 003 | 欣德101 |
| 003 | 化学102 |
| 004 | PSYC101 |
| 004 | 化学102 |
| 004 | 欣德101 |
我想知道学生最常一起修读哪些课程组合。我从 2 道菜组合开始,但也可能想看看 3 道菜组合。
我完全不知道这个程序的名称。
我发现这个使用该dplyr包的类似示例:/sf/ask/4312923471/
但是,我不认为这正是我想要的。当某些学生修读了 2 门以上课程时,我想要所有可能的 2 门课程组合。例如,对于学生 3,他们将具有以下内容:
然后,我会找到所有学生中最常见的组合。