我想按特定列对DataFrame进行分组,然后应用sklearn预处理MinMaxScaler并存储缩放器对象.
我此刻的起点:
import pandas as pd
from sklearn import preprocessing
scaler = {}
groups = df.groupby('ID')
for name, group in groups:
scr = preprocessing.MinMaxScaler()
scr.fit(group)
scaler.update({name: scr})
group = scr.transform(group)
Run Code Online (Sandbox Code Playgroud)
这有可能df.groupby('ID').transform吗?
UPDATE
从我原来的DataFrame
pd.DataFrame( dict( ID=list('AAABBB'),
VL=(0,10,10,100,100,200))
Run Code Online (Sandbox Code Playgroud)
我想根据ID扩展所有列.在这个例子中:
A 0.0
A 1.0
A 1.0
B 0.0
B 0.0
B 1.0
Run Code Online (Sandbox Code Playgroud)
使用信息/缩放器对象(使用fit初始化)
preprocessing.MinMaxScaler().fit( ... )
Run Code Online (Sandbox Code Playgroud)