我有全部用小写字母存储的关键字,例如“我正在尝试对其进行实体提取”。我遇到的问题是,对于NER,spaCy似乎区分大小写。请注意,我不认为这是特定于空间的。
我跑步的时候
doc = nlp(u"i love nike shoes from the uk")
for ent in doc.ents:
print(ent.text, ent.start_char, ent.end_char, ent.label_)
Run Code Online (Sandbox Code Playgroud)
...什么也没返回。
我跑步的时候
doc = nlp(u"i love Nike shoes from the Uk")
for ent in doc.ents:
print(ent.text, ent.start_char, ent.end_char, ent.label_)
Run Code Online (Sandbox Code Playgroud)
我得到以下结果...
Nike 7 11 ORG
Uk 25 27 GPE
Run Code Online (Sandbox Code Playgroud)
我是否应该对所有内容都加标题?我可以使用其他解决方法吗?