小编War*_*ckQ的帖子

BERTopic 的停用词删除和词干提取/词形还原

对于主题建模,我正在尝试 BERTopic:链接

我在这里有点困惑,我正在我的自定义数据集上尝试 BERTopic。
由于 BERT 的训练方式使其能够保存文本/文档的语义,因此我是否应该在将文档传递到 BERTopic 之前删除停用词并对文档进行词干/词形还原?因为我担心这些停用词是否会作为显着术语进入我的主题,而它们并不是

请大家提出建议和建议!

python nlp topic-modeling bert-language-model

3
推荐指数
1
解决办法
6313
查看次数

标签 统计

bert-language-model ×1

nlp ×1

python ×1

topic-modeling ×1