小编Res*_*her的帖子

如何识别组内最常见的值组合?

我有一个表,其中每一行代表一名学生在一门课程中的注册情况,与此类似,但要大得多:

学生 课程
001 PSYC101
001 化学102
002 PSYC101
002 斯潘101
002 生物101
003 生物101
003 英语201
003 欣德101
003 化学102
004 PSYC101
004 化学102
004 欣德101

我想知道学生最常一起修读哪些课程组合。我从 2 道菜组合开始,但也可能想看看 3 道菜组合。

我完全不知道这个程序的名称。

我发现这个使用该dplyr包的类似示例:/sf/ask/4312923471/

但是,我不认为这正是我想要的。当某些学生修读了 2 门以上课程时,我想要所有可能的 2 门课程组合。例如,对于学生 3,他们将具有以下内容:

  • BIO101 和 ENG201
  • BIO101 & HIND101
  • 生物101 & 化学102
  • ENG201 和 HIND101
  • ENG201 和 CHEM102
  • HIND101 和 CHEM102

然后,我会找到所有学生中最常见的组合。

combinations r

6
推荐指数
2
解决办法
188
查看次数

标签 统计

combinations ×1

r ×1