相关疑难解决方法(0)

如何存储TfidfVectorizer以供将来在scikit-learn中使用?

我有一个TfidfVectorizer矢量化文章集合,然后是特征选择.

vectroizer = TfidfVectorizer()
X_train = vectroizer.fit_transform(corpus)
selector = SelectKBest(chi2, k = 5000 )
X_train_sel = selector.fit_transform(X_train, y_train)
Run Code Online (Sandbox Code Playgroud)

现在,我想存储它并在其他程序中使用它.我不想TfidfVectorizer()在训练数据集上重新运行和选择特征选择器.我怎么做?我知道如何使模型持久使用,joblib但我想知道这是否与使模型持久化相同.

python tf-idf python-3.x scikit-learn joblib

14
推荐指数
3
解决办法
9072
查看次数

标签 统计

joblib ×1

python ×1

python-3.x ×1

scikit-learn ×1

tf-idf ×1