我有一个保存的逻辑回归模型,我用训练数据训练它并使用 joblib 保存。我试图在不同的脚本中加载这个模型,向它传递新数据并根据新数据进行预测。
我收到以下错误“sklearn.exceptions.NotFittedError: CountVectorizer - Vocabulary is not fit”。我需要再次拟合数据吗?我原以为能够保存模型的重点是不必这样做。
我使用的代码如下,不包括数据清理部分。任何帮助预测工作将不胜感激。
new_df = pd.DataFrame(latest_tweets,columns=['text'])
new_df.to_csv('new_tweet.csv',encoding='utf-8')
csv = 'new_tweet.csv'
latest_df = pd.read_csv(csv)
latest_df.dropna(inplace=True)
latest_df.reset_index(drop=True,inplace=True)
new_x = latest_df.text
loaded_model = joblib.load("finalized_mode.sav")
tfidf_transformer = TfidfTransformer()
cvec = CountVectorizer()
x_val_vec = cvec.transform(new_x)
X_val_tfidf = tfidf_transformer.transform(x_val_vec)
result = loaded_model.predict(X_val_tfidf)
print (result)
Run Code Online (Sandbox Code Playgroud)