Mik*_*las 22
自然语言软件通过利用语料库及其提供的统计数据来发挥其神奇功效.你需要告诉nltk一些德语语料库来帮助它正确地标记德语.我相信EUROPARL语料库可能会帮助您前进.
有关示例配置,请参阅nltk.corpus.europarl_raw和此答案.
另外,请考虑使用"nlp"标记此问题.
Suz*_*ana 12
该模式库包括用于解析德国句子的功能和结果中包含部分的语音标签.从他们的文档中复制以下内容:
from pattern.de import parse, split
s = parse('Die Katze liegt auf der Matte.')
s = split(s)
print s.sentences[0]
>>> Sentence('Die/DT/B-NP/O Katze/NN/I-NP/O liegt/VB/B-VP/O'
'auf/IN/B-PP/B-PNP der/DT/B-NP/I-PNP Matte/NN/I-NP/I-PNP ././O/O')
Run Code Online (Sandbox Code Playgroud)
如果您更喜欢SSTS标记集,则可以设置可选参数tagset="STTS".