小编ath*_*_nn的帖子

max_df对应的文档比Ridge分类器中的min_df错误更大

我用大量数据训练了岭分类器,这些数据用于tfidf vecotrizer矢量化数据,并且过去工作良好。但是现在我面临一个错误

'max_df对应于<min_df个文档'

数据存储在Mongodb中。
我尝试了各种解决方案,最后,当我在Mongodb中删除了只有1个文档(1条记录)的集合时,它正常工作并照常完成了培训。

但是我需要一个不需要删除记录的解决方案,因为我需要该记录。

另外,我不理解该错误,因为它仅在我的机器中运行。即使该记录存在于db中,该脚本也可以在我的系统中正常运行,该脚本在其他系统中也可以正常运行。

有人可以帮忙吗?

machine-learning tf-idf mongodb

6
推荐指数
1
解决办法
4150
查看次数

标签 统计

machine-learning ×1

mongodb ×1

tf-idf ×1