相关疑难解决方法(0)

Pandas groupby结合sklearn预处理

我想按特定列对DataFrame进行分组,然后应用sklearn预处理MinMaxScaler并存储缩放器对象.

我此刻的起点:

import pandas as pd
from sklearn import preprocessing

scaler = {}
groups = df.groupby('ID')

for name, group in groups:
  scr = preprocessing.MinMaxScaler()
  scr.fit(group)
  scaler.update({name: scr})
  group = scr.transform(group)
Run Code Online (Sandbox Code Playgroud)

这有可能df.groupby('ID').transform吗?

UPDATE

从我原来的DataFrame

pd.DataFrame( dict( ID=list('AAABBB'),
                    VL=(0,10,10,100,100,200))
Run Code Online (Sandbox Code Playgroud)

我想根据ID扩展所有列.在这个例子中:

   A 0.0
   A 1.0
   A 1.0
   B 0.0
   B 0.0
   B 1.0
Run Code Online (Sandbox Code Playgroud)

使用信息/缩放器对象(使用fit初始化)

preprocessing.MinMaxScaler().fit( ... )
Run Code Online (Sandbox Code Playgroud)

scipy pandas

6
推荐指数
1
解决办法
1901
查看次数

标签 统计

pandas ×1

scipy ×1