我的项目的目标是回答诸如以下问题:"我正在寻找20到30岁之间在Google工作的美国女性"然后我必须处理查询并查看数据库以找到答案.
为此,我需要结合斯坦福3级NERTagger和我自己的标记器.实际上,我的NER标签可以标记年龄,国籍和性别.但我需要斯坦福标记来标记组织,因为我没有任何培训文件.
现在,我有一个像这样的代码:
def __init__(self, q):
self.userQuery = q
def get_tagged_tokens(self):
st = NERTagger('C:\stanford-ner-2015-01-30\my-ner-model.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
result = st.tag(self.userQuery.split())[0]
return result
Run Code Online (Sandbox Code Playgroud)
我希望有这样的事情:
def get_tagged_tokens(self):
st = NERTagger('C:\stanford-ner-2015-01-30\my-ner-model.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
st_def = NERTagger('C:\stanford-ner-2015-01-30\classifiers\english.all.3class.distsim.crf.ser.gz','C:\stanford-ner-2015-01-30\stanford-ner.jar')
tagger = BackoffTagger([st, st_def])
result = st.tag(self.userQuery.split())[0]
return result
Run Code Online (Sandbox Code Playgroud)
这意味着标记器首先使用我的标记器,然后使用stanford标记标记未标记的单词.
是否可以将我的模型与斯坦福模型结合起来以标记组织?如果是,那么执行此操作的最佳方式是什么?
谢谢!