小编Fac*_*pai的帖子

如何将标准化应用于训练和测试数据集

假设我有一个shape的10特征数据集和一个Xshape[100, 10]y目标数据集[100, 1]。例如,将两者分开后,sklearn.model_selection.train_test_split我得到:

  • X_train: [70, 10]
  • X_test: [30, 10]
  • y_train: [70, 1]
  • y_test: [30, 1]

应用标准化的正确方法是什么?

我试过:

from sklearn import preprocessing
scaler = preprocessing.StandardScaler()

scaler.fit(X_train)

X_train_std = scaler.transform(X_train)
X_test_std = scaler.transform(X_test)
Run Code Online (Sandbox Code Playgroud)

但是如果我尝试使用模型进行预测,当我尝试反转缩放以查看 MAE 时,我会出错

from sklearn import linear_model
lr = linear_model.LinearRegression()
lr.fit(X_train_std, y_train)
y_pred_std = lr.predict(X_test_std)

y_pred = scaler.inverse_transform(y_pred_std) # error here
Run Code Online (Sandbox Code Playgroud)


我还有一个问题。由于我有目标值,我应该使用

scaler = preprocessing.StandardScaler()

X_train_std = scaler.fit_transform(X_train, y_train)
X_test_std = scaler.transform(X_test)
Run Code Online (Sandbox Code Playgroud)

而不是第一个代码块?


我是否也必须将转换应用于y_trainy_test …

python machine-learning scikit-learn

3
推荐指数
1
解决办法
1583
查看次数

在Android中保存文件的正确路径

我正在尝试为 Android 编写一个应用程序,我需要从服务器保存 resposne,我设法通过将其保存在此路径中的 txt 文件中来做到这一点:

String path= "/storage/emulated/0/Android/data/com.example.simone.pizzino/files/response.txt"; final File file = new File(path);

在我朋友的手机上测试,他看不到那个路径下的文件夹,他的路径类似于data/data/"packageName",它也不适用于 Android Studio 中的模拟器。我的手机是运行 7.1 库存 rom 的 Nexus 5X。我的朋友使用 6.1 扎根。有没有办法获得应用程序文件夹的动态路径而不必将其声明为常量?

抱歉,如果已经问过这个问题,但我找不到解决我的问题的方法。

android android-file

2
推荐指数
1
解决办法
1万
查看次数