使用nltk将日期识别为命名实体?

gre*_*lue 4 named-entity-recognition nltk

我正在尝试使用NLTK命名实体标记器来识别各种命名实体.在使用Python的自然语言处理书中,他们提供了一个常用命名权限列表(表7.4,如果有人好奇的话),其中包括:DATE June,2008-06-29和TIME two af 50 am,1:30 pm所以我得到了令人印象深刻的是,这可以通过NLTK的命名实体标记器完成.

但是,当我运行标记器时,它似乎根本没有提取日期或时间,因为它是人或组织.NLTK命名实体标记器是否不处理这些日期/时间情况,还是只选择特定的日期/时间格式?如果它不处理这些情况,有人知道一个系统吗?或者是创建我自己唯一的解决方案?

谢谢!

Spa*_*ost 10

您应该查看NLTK的contrib存储库 - 包含一个名为timex.py的模块或在此处下载:https: //github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

从模块的第一行:

# Code for tagging temporal expressions in text