使用Stanford NER从文本文档中提取地址?

yad*_*dab 9 java text-processing stanford-nlp

我正在寻找斯坦福NER并考虑使用JAVA Apis来从文本文档中提取邮政地址.该文件可以是任何有邮政地址部分的文件,例如电费单,电费单.

所以我的想法是,

  1. 使用LOCATION和其他原始命名实体将邮政地址定义为命名实体.
  2. 定义细分和其他子流程.

我试图找到一个相同的示例管道(需要详细的步骤是什么),任何人之前都做过这个?建议欢迎.

Fre*_*ijn 2

需要明确的是:所有功劳都归功于 Raj Vardhan(和 John Bauer),他们在[java-nlp-user]邮件列表上进行了互动。

Raj Vardhan 写了关于“在句子中查找街道地址”的计划:

这是我想到的一个方法:

  1. 找到句子中的事件锚点
  2. 从具有诸如*“prep-in”*或“prep-at”等关系的事件节点选择语义图中的传出边
  3. 如果关系中的依赖值具有 POS 标记作为 NNP

a) 从依赖值的节点中查找具有诸如“nn”之类的关系的出边

b) 按照句子中出现的升序连接所有这些节点。

c) 将结果值打印为事件发生的位置

这显然是基于某些假设,例如事件锚点和句子中的位置之间的直接依赖关系。

不确定这是否对您有帮助,但我想提一下以防万一。再次强调,任何功劳都应归功于 Raj Vardhan(和 John Bauer)。