use*_*132 4 nlp named-entity-recognition spacy
我是NLP的新手,最近一直在玩NTLK和Spacy.但是,我找不到在文章中搜索职称(例如:产品经理,首席营销官等)的方法.
例如,我有1000篇文章,我想获得所有我感兴趣的职称的文章.
此外,职称属于哪种实体类型?我检查https://spacy.io/docs/usage/entity-recognition并没有在那里看到它.我有计划添加它吗?
谢谢.
Nathan表示,Spacy NER不支持"职位名称"实体.但您可以为您的用例创建自定义命名实体.这是官方文档链接.你可以找到一步一步的指南,在那里训练Spacy NER.
您需要标记数据来训练您的NER.一般来说,您需要至少4000-5000列车和2000例测试示例.您拥有的训练数据越多,NER表现就越好.
以下是一些示例训练数据.
TRAIN_DATA = [
('Who is Shaka Khan?', {
'entities': [(7, 17, 'PERSON')]
}),
('I like London and Berlin.', {
'entities': [(7, 13, 'LOC'), (18, 24, 'LOC')]
}),
('I work as software engineer.', {
'entities': [(9, 18, 'JOBTITLE')]
}),
]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1497 次 |
| 最近记录: |