NLP 文本标记

use*_*811 5 nlp machine-learning

我是 NLP 的新手,第一次做。我正在尝试解决一个问题。

我的问题是我有一些手动标记的文档,例如:

doc1 - categoryA, categoryB
doc2 - categoryA, categoryC
doc3 - categoryE, categoryF, categoryG
.
.
.
.
docN - categoryX
Run Code Online (Sandbox Code Playgroud)

这里我有一组固定的类别,任何文档都可以有任意数量的与其关联的标签。我想使用这个输入来训练分类器,以便这个标记过程可以自动化。

谢谢

Joh*_*ann 4

您尝试做的事情称为多路监督文本分类(或分类)。知道要问正确的问题就解决了一半问题。

至于如何做到这一点,这里有两个参考: