我发现很难用语言解释我想要实现的目标,所以请不要因为我展示了一个简单的例子而评判我。我有一个看起来像这样的表:
| 主列 | 一些元数据 | 价值 |
|---|---|---|
| 这 | 真的 | 10 |
| 这 | 错误的 | 3 |
| 那 | 真的 | 50 |
| 那 | 错误的 | 10 |
| 其他 | 真的 | 20 |
| 其他 | 错误的 | 5 |
我想针对 的每种情况分别标准化这些数据main_col。例如,如果我们选择最小-最大归一化并将其缩放到范围 [0; 100],我希望输出如下所示:
| 主列 | 一些元数据 | 值(标准化) |
|---|---|---|
| 这 | 真的 | 100 |
| 这 | 错误的 | 30 |
| 那 | 真的 | 100 |
| 那 | 错误的 | 20 |
| 其他 | 真的 | 100 |
| 其他 | 错误的 | 25 |
其中对于 的每种情况main_col,最高值缩放为 100,另一个值按相应比例缩放。