对于主题建模,我正在尝试 BERTopic:链接
我在这里有点困惑,我正在我的自定义数据集上尝试 BERTopic。 由于 BERT 的训练方式使其能够保存文本/文档的语义,因此我是否应该在将文档传递到 BERTopic 之前删除停用词并对文档进行词干/词形还原?因为我担心这些停用词是否会作为显着术语进入我的主题,而它们并不是
请大家提出建议和建议!
python nlp topic-modeling bert-language-model
bert-language-model ×1
nlp ×1
python ×1
topic-modeling ×1