小编gpr*_*inz的帖子

scikit-learn 如何处理多个 n_jobs 参数?

我在 scikit-learn 中创建了一个管道,如下所示:

estimators2 = [
    ('tfidf', TfidfVectorizer(tokenizer=lambda string: string.split())),
    ('clf', SGDClassifier(n_jobs=13, early_stopping=True, class_weight='balanced'))
]
parameters2 = {
    'tfidf__min_df': np.arange(10, 30, 10),
    'tfidf__max_df': np.arange(0.75, 0.9, 0.05),
    'tfidf__ngram_range': [(1, 1), (2, 2), (3, 3)],
    'clf__alpha': (1e-2, 1e-3)
}

p2 = Pipeline(estimators2)
grid2 = RandomizedSearchCV(p2, param_distributions=parameters2, 
                           scoring='balanced_accuracy', n_iter=20, cv=3, n_jobs=13, pre_dispatch='n_jobs')
Run Code Online (Sandbox Code Playgroud)

在这个管道中,有两次参数n_jobs?scikit-learn 如何处理它们?

python parallel-processing scikit-learn

3
推荐指数
1
解决办法
3088
查看次数

标签 统计

parallel-processing ×1

python ×1

scikit-learn ×1