如何选择模块中max_features参数的编号TfidfVectorizer?我应该使用数据中的最大元素数量吗?
max_features
TfidfVectorizer
参数的描述并没有让我清楚地了解如何为它选择值:
max_features:int或None,默认= None 如果不是None,则构建一个词汇表,仅考虑语料库中按术语频率排序的最高max_features.如果词汇表不是None,则忽略此参数.
max_features:int或None,默认= None
如果不是None,则构建一个词汇表,仅考虑语料库中按术语频率排序的最高max_features.如果词汇表不是None,则忽略此参数.
scikit-learn
scikit-learn ×1