解析和词性标注有什么区别?

Bha*_*thi 5 parsing nlp part-of-speech stanford-nlp

我知道词性标记会用适当的词性来标记句子中的每个单词,但这不也是解析器所做的吗?即,将一个句子分解为其组成部分?我在互联网上查过这一点,但找不到任何令人满意的解释。请解答我的疑惑。提前致谢

Oli*_*son 4

它们是两个不同的过程:

  • 词性标记:每个标记都会分配一个反映其词类的标签。

  • 解析:每个句子都被分配一个结构(通常是一棵树),该结构反映了其组成部分如何相互关联。

词性标记采用标记化的单词序列,并返回带注释的标记列表,其中每个标记都有一个词类标签。这通常可以通过查看令牌周围的上下文来消除歧义。

还有分块,它将标记分为相关组(例如名词短语)。块是不重叠的序列。

解析通常会产生一个句子的解析树;通常,在句子歧义的情况下,可能有很多可能的树。

词性标记通常是解析中的准备步骤,因为解析器通常对词类进行操作(尽管有一些解析算法直接处理标记,或标记和标记的混合)。