如何解释NLTK Brill Tagger规则

don*_*ngx 2 nlp nltk part-of-speech

对于生成的Brill Tagger规则:

Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
Run Code Online (Sandbox Code Playgroud)

我知道: 'CS'是从属连词 'QL'是限定词

我想: [(Word([1, 2, 3]),'as')]意味着规则的条件.它代表单词'as'出现在目标单词之前的第一个,第二个或第三个位置.目标词是将由POS标签标记的词.

我不知道:这是什么意思'016'?如何解释整个规则?

b30*_*000 5

规则的文档在这里. 016将是templateid,即用于创建规则的模板.您还可以获取规则的说明:

q = Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
q.format('verbose')
'CS -> QL if the Word of words i+1...i+3 is "as"'
Run Code Online (Sandbox Code Playgroud)

在这种情况下,它实际上是目标词之后的词.(表示i+1...)