我正在尝试使用Rasa创建一个简单的程序,它从文本输入中提取(法语)街道地址.
根据Rasa-NLU doc(http://rasa-nlu.readthedocs.io/en/latest/entities.html)中的建议,我想使用spaCy进行地址检测.
我看到(https://spacy.io/usage/training)相应的spaCy预建实体LOC.
但是,我不明白如何使用此实体创建训练数据集.
以下是我目前的JSON培训数据集的摘录:
{
"text" : "je vis au 2 Rue des Platanes",
"intent" : "donner_adresse",
"entities" : [
{
"start" : 10,
"end" : 28,
"value" : 2 Rue des Platanes",
"entity" : "adresse"
}
]
}
Run Code Online (Sandbox Code Playgroud)
如果我训练程序并使用文本输入运行它"je vis au 2 Rue des Hetres",我得到这个输出:
{
"entities": [
"end": 26,
"entity": "adresse",
"extractor": "ner_crf",
"start": 10,
"value": "2 rue des hetres"
],
"intent": null,
"intent_ranking": [],
"text": "je vis au 2 Rue des Hetres"
}
Run Code Online (Sandbox Code Playgroud)
根据我的训练数据集,这很好.但我想使用spaCy的LOC实体.
我怎样才能做到这一点?(我究竟做错了什么 ?)
以下是我的配置文件的相关摘要,如果需要:
{
"pipeline" : "spacy_sklearn",
"language" : "fr",
"spacy_model_name" : "fr_core_news_md"
}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1245 次 |
| 最近记录: |