小编Rya*_*app的帖子

斯坦福POS Tagger没有标记中文文本

我正在使用Stanford POS Tagger(这是第一次),虽然它正确地标记了英文,但即使更改模型参数,它也似乎无法识别(简体)中文.我忽略了什么吗?

我从这里下载并解压缩了最新的完整版本:http: //nlp.stanford.edu/software/tagger.shtml

然后我将样本文本输入"sample-input.txt".

这是一个测试的句子.这是另一个句子.

然后我就跑了

./stanford-postagger.sh models/chinese-distsim.tagger sample-input.txt

预期的输出是用词性标记每个单词,而是将整个文本字符串识别为一个单词:

从tagger models/chinese-distsim.tagger加载默认属性

从models/chinese-distsim.tagger中读取POS标记模型...完成[3.5秒].

这是一个测试的句子.这是另一个句子.#NR

标记为1个单词,每秒30.30个单词.

我感谢任何帮助.

linux nlp pos-tagger stanford-nlp

5
推荐指数
1
解决办法
829
查看次数

标签 统计

linux ×1

nlp ×1

pos-tagger ×1

stanford-nlp ×1