我正在使用Stanford POS Tagger(这是第一次),虽然它正确地标记了英文,但即使更改模型参数,它也似乎无法识别(简体)中文.我忽略了什么吗?
我从这里下载并解压缩了最新的完整版本:http: //nlp.stanford.edu/software/tagger.shtml
然后我将样本文本输入"sample-input.txt".
这是一个测试的句子.这是另一个句子.
然后我就跑了
./stanford-postagger.sh models/chinese-distsim.tagger sample-input.txt
预期的输出是用词性标记每个单词,而是将整个文本字符串识别为一个单词:
从tagger models/chinese-distsim.tagger加载默认属性
从models/chinese-distsim.tagger中读取POS标记模型...完成[3.5秒].
这是一个测试的句子.这是另一个句子.#NR
标记为1个单词,每秒30.30个单词.
我感谢任何帮助.