NLP新手,关于注释的问题

Sap*_*Sap 2 java nlp annotations

我是NLP的新手,我正在寻找一个起点,就一些教程,文档或示例代码而言.我被告知要研究处理自然文本以从中提取一些结构化数据的可能性.例如,我想从以下语句中提取(注释)高度和重量."他身高6英尺,体重200磅"或"身高6英尺,体重200"等.我调查了UIMA,但它似乎是一个自创的REGEX词典,没有训练能力.简而言之,我可以使用什么Java框架来创建可以训练的注释引擎!任何帮助(指针)将非常感谢.谢谢

crn*_*nlx 5

因为您要求提供指针:LingPipe(已在上面提到),OpenNLPStanford NLP发行版.

注意:如果Python是一个选项,您可以使用Natural Language Toolkit.