小编rgl*_*enn的帖子

删除词汇表TF-IDF中单个出现的单词

我试图删除在我的词汇中出现一次的单词以减少我的词汇量.我正在使用sklearn TfidfVectorizer(),然后在我的数据框上使用fit_transform函数.

tfidf = TfidfVectorizer()  
tfs = tfidf.fit_transform(df['original_post'].values.astype('U')) 
Run Code Online (Sandbox Code Playgroud)

我首先想到的是tfidf矢量化器中的预处理器字段,或者在机器学习之前使用预处理包.

任何进一步实施的提示或链接?

python tf-idf scikit-learn

4
推荐指数
1
解决办法
3096
查看次数

标签 统计

python ×1

scikit-learn ×1

tf-idf ×1