小编LM9*_*M91的帖子

NLTK:结合stanford tagger和个人标记器

我的项目的目标是回答诸如以下问题:"我正在寻找20到30岁之间在Google工作的美国女性"然后我必须处理查询并查看数据库以找到答案.

为此,我需要结合斯坦福3级NERTagger和我自己的标记器.实际上,我的NER标签可以标记年龄,国籍和性别.但我需要斯坦福标记来标记组织,因为我没有任何培训文件.

现在,我有一个像这样的代码:

def __init__(self, q):
    self.userQuery = q
def get_tagged_tokens(self):
    st = NERTagger('C:\stanford-ner-2015-01-30\my-ner-model.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
    result = st.tag(self.userQuery.split())[0]
    return result

Run Code Online (Sandbox Code Playgroud)

我希望有这样的事情:

def get_tagged_tokens(self):
    st = NERTagger('C:\stanford-ner-2015-01-30\my-ner-model.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
    st_def = NERTagger('C:\stanford-ner-2015-01-30\classifiers\english.all.3class.distsim.crf.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
    tagger = BackoffTagger([st, st_def])
    result = st.tag(self.userQuery.split())[0]
    return result

Run Code Online (Sandbox Code Playgroud)

这意味着标记器首先使用我的标记器,然后使用stanford标记标记未标记的单词.

是否可以将我的模型与斯坦福模型结合起来以标记组织？如果是,那么执行此操作的最佳方式是什么？

谢谢!

python nlp named-entity-recognition nltk stanford-nlp

LM9*_*M91

2015 12-06

1
推荐指数

1
解决办法

1098
查看次数