从文本中提取日期

Swa*_*esh 4 nlp date stanford-nlp

我正在尝试使用斯坦福NLP工具提取日期(8/11/2012)表单文本.

这是一个链接!用于此工具的演示

你可以帮助我如何培训分类器来确定日期(2012年11月8日).

我尝试使用训练数据

Woodhouse PERS 8/18/2012日期,O帅O.

但不适用于相同的测试数据.

tys*_*njh 7

如果这是你想要完成的所有工作,使用NLP工具从文本中提取日期似乎有些过分.您应该考虑其他选项,如简单的Java正则表达式(例如,此处).

如果您正在做一些需要Stanford NLP工具的更多功能的东西,请查看SUTime注释器.他们的演示页面将让您了解它的行为方式.确保选中该选项Read rules from file,您将看到日期被注释.

用法:

SUTime annotations are provided automatically with the StanfordCoreNLP pipeline by including the ner annotator.
Run Code Online (Sandbox Code Playgroud)


Chr*_*ing 5

您当然可以训练基于 CRF 的 NER 来识别日期和时间。您可以通过运行提供的 english.muc.7class.distsim.crf.ser.gz 模型来查看示例。请参阅培训 NER 系统的常见问题解答。但请注意,我们用于时间/日期识别的主要工具现在是基于正则表达式的:SUTime。您还可以为其他应用程序编写 SUTime 规则。请参阅SUTime 页面以及该页面上 TokensRegex 的链接。