如何获取所有人的姓名数据库(或至少是英语常用名称)?

Tam*_*Tam 5 string

我正在设计一个需要从短文中提取人名的应用程序.

最好的方法是什么?是否有一个名称数据库,我可以测试,知道名称在哪里?虽然文本很短,但在处理需求方面可能不那么密集.

有任何想法吗?

谢谢,

Joã*_*lva 7

您可以使用统计命名实体识别器(NER),例如Stanford的NERLingPipe.这些是基于机器学习的识别器,不需要巨大的名称字典作为输入.

或者,您可以从Web获取人名列表(有很多),并使用Aho-Corasick字符串搜索算法从文本中有效地从列表中提取名称.