我有一个相对简单的问题,但一直找不到解决方案。
假设我有以下数据集:
| ID | 虚拟变量 | 字符串1 | 字符串2 | 字符串3 |
|---|---|---|---|---|
| 1 | 0 | 汤姆 | 不适用 | 不适用 |
| 1 | 1 | 不适用 | 乔 | 不适用 |
| 2 | 0 | 汤姆 | 不适用 | 不适用 |
| 2 | 1 | 不适用 | 乔 | 不适用 |
| 2 | 0 | 不适用 | 不适用 | 鲍勃 |
| 3 | 0 | 史蒂夫 | 不适用 | 不适用 |
| 3 | 0 | 不适用 | 提米 | 不适用 |
| 4 | 0 | 亚历克斯 | 不适用 | 不适用 |
我想使用 group by 和 summarise 来得到以下内容:
| ID | 虚拟变量 | 字符串1 | 字符串2 | 字符串3 |
|---|---|---|---|---|
| 1 | 1 | 汤姆 | 乔 | 不适用 |
| 2 | 1 | 汤姆 | 乔 | 鲍勃 |
| 3 | 0 | 史蒂夫 | 提米 | 不适用 |
| 4 | 0 | 亚历克斯 | 不适用 | 不适用 |
我对“dummy_var”没有遇到任何问题,在汇总函数中使用 dummy_var …