命名实体识别的算法

caw*_*caw 22 php python analysis extract named-entity-recognition

我想使用命名实体识别(NER)来为数据库中的文本找到足够的标签.

我知道维基百科有关于此的文章以及许多描述NER的其他页面,我最好从您那里听到有关此主题的内容:

  • 您使用各种算法有什么经验?
  • 你会推荐哪种算法?
  • 哪种算法最容易实现(PHP/Python)?
  • 如何算法工作?是否需要手动培训?

例:

"去年,我在伦敦看到巴拉克奥巴马." =>标签:伦敦,巴拉克奥巴马

我希望你能帮助我.非常感谢你提前!

Ale*_*Ale 13

首先查看http://www.nltk.org/,如果你计划使用python,虽然据我所知,代码不是"工业强度",但它会让你开始.

查看http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html中的第7.5节,但要了解您可能需要阅读的大量本书的算法.

另请查看http://nlp.stanford.edu/software/CRF-NER.shtml.这是用java完成的,

NER不是一个容易的主题,可能没有人会告诉你"这是最好的算法",大多数都有他们的优点/缺点.

我的0.05美元.

干杯,