Isa*_* GS 7 python machine-learning scikit-learn
好的,我只想说,我对 SciKit-Learn 和数据科学完全陌生。但这是问题和我目前对这个问题的研究。代码在底部。
我正在尝试使用 BernoulliRBM 进行类型识别(例如数字),并且我正在尝试使用 GridSearchCV 找到正确的参数。但是,我没有看到任何事情发生。有很多使用详细设置的例子,我看到了输出和进度,但我的只是说,
Fitting 3 folds for each of 15 candidates, totalling 45 fits
Run Code Online (Sandbox Code Playgroud)
然后它坐在那里什么也不做......永远(或 8 小时,我用高详细设置等待的最长时间)。
我有一个非常大的数据集(1000 个 2D 数组,每个数组的大小为 428 x 428),所以这可能是问题所在,但我还将详细程度设置为 10,所以我觉得我应该看到某种输出或进展。此外,就我的“目标”而言,它要么是 0,要么是 1,要么是我正在寻找的对象(1),要么不是(0)。
我篡改了 gridsearchcv 的各种参数,并尝试创建假的(较小的)数据集来练习。
def network_trainer(self, data, files):
train_x, test_x, train_y, test_y = train_test_split(data, files, test_size=0.2, random_state=0)
parameters = {'learning_rate':np.arange(.25, .75, .1), 'n_iter':[5, 10, 20]}
model = BernoulliRBM(random_state=0, verbose=True)
model.cv = 2
model.n_components = 2
logistic = linear_model.LogisticRegression()
pipeline = Pipeline(steps=[('model', model), ('clf', logistic)])
gscv = grid_search.GridSearchCV(pipeline, parameters, n_jobs=-1, verbose=10)
gscv.fit(train_x, train_y)
print gscv.best_params_
Run Code Online (Sandbox Code Playgroud)我真的很感激这里朝着正确方向的推动。感谢您考虑我的问题。
好的,所以只是总结一下我在过去几天里对它的了解。
我再次感谢@Barmaley.exe 的初步提示。
| 归档时间: |
|
| 查看次数: |
4124 次 |
| 最近记录: |