小编Rub*_*ben的帖子

将分类器带到生产中

我使用joblib保存了我的分类器管道:

vec = TfidfVectorizer(sublinear_tf=True, max_df=0.5, ngram_range=(1, 3))
pac_clf = PassiveAggressiveClassifier(C=1)
vec_clf = Pipeline([('vectorizer', vec), ('pac', pac_clf)])
vec_clf.fit(X_train,y_train)
joblib.dump(vec_clf, 'class.pkl', compress=9)
Run Code Online (Sandbox Code Playgroud)

现在我正在尝试在生产环境中使用它:

def classify(title):

  #load classifier and predict
  classifier = joblib.load('class.pkl')

  #vectorize/transform the new title then predict
  vectorizer = TfidfVectorizer(sublinear_tf=True, max_df=0.5, ngram_range=(1, 3))
  X_test = vectorizer.transform(title)
  predict = classifier.predict(X_test)
  return predict
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:ValueError:词汇表没有安装或是空的!我想我应该从te joblid加载词汇表,但我不能让它工作

python scikit-learn joblib

5
推荐指数
1
解决办法
2972
查看次数

标签 统计

joblib ×1

python ×1

scikit-learn ×1