Kla*_*sos 6 python scikit-learn
Python中是否有用于进行数据转换的包:缩放,居中和Box-Cox转换以消除数据的偏差?在R中,这可以使用caret包来完成:
set.seed(1)
predictors = data.frame(x1 = rnorm(1000,
mean = 5,
sd = 2),
x2 = rexp(1000,
rate=10))
require(caret)
trans = preProcess(predictors,
c("BoxCox", "center", "scale"))
predictorsTrans = data.frame(
trans = predict(trans, predictors))
Run Code Online (Sandbox Code Playgroud)
我知道sklearn,但我无法找到上述处理功能.
小智 17
对于缩放和居中您可以使用preprocessing从sklearn:
from sklearn import preprocessing
centered_scaled_data = preprocessing.scale(original_data)
Run Code Online (Sandbox Code Playgroud)
对于箱考克斯你可以使用boxcox从scipy:
from scipy.stats import boxcox
boxcox_transformed_data = boxcox(original_data)
Run Code Online (Sandbox Code Playgroud)
对于偏度,你可以使用的计算skew来自scipy:
from scipy.stats import skew
skness = skew(original_data)
Run Code Online (Sandbox Code Playgroud)
您可以在这篇文章中阅读有关解决偏斜的更多细节.此外,您还可以在此处找到有关居中和缩放的更多详细信息.