我希望从非常短的文本示例中提取名称和位置
"cardinals vs jays in toronto" " Daniel Nestor and Nenad Zimonjic play Jonas Bjorkman w/ Kevin Ullyett, paris time to be announced" "jenson button - pole position, brawn-mercedes - monaco".
这个数据目前在MySQL数据库中,我(几乎)为每个运动员都有一个单独的记录,虽然名字有时拼写错误等.
我想提取运动员和位置.我通常使用PHP工作,但是无法找到用于实体提取的库(我可能希望将来更深入地学习一些NLP和ML).
从我发现的,LingPipe和NLTK似乎是最推荐的,但我无法弄清楚是否真的适合我的目的,或者其他什么会更好.
我没有用Java或Python编程,所以在开始学习新语言之前,我希望能得到一些关于我应该遵循的路线或其他建议的建议.
| 归档时间: |
|
| 查看次数: |
3867 次 |
| 最近记录: |