我在conll2002格式中有一个带注释的语料库,即一个制表符分隔文件,带有一个标记,pos-tag和IOB标记,后跟实体标记.例:
John NNP B-PERSON
我想在NLTK中训练一个葡萄牙语 NER模型,最好是MaxEnt模型.我不希望使用NLTK的"内置"斯坦福大学NER,因为我已经能够使用独立的斯坦福NER.我想使用MaxEnt模型作为斯坦福NER的比较.
我找到了NLTK培训师,但我无法使用它.
我怎样才能做到这一点?
python nlp named-entity-recognition nltk
named-entity-recognition ×1
nlp ×1
nltk ×1
python ×1