识别文本中的地理位置

Rob*_*ell 9 nlp geography

为确定特定字符串是否属于某个地理位置,我们做了哪些工作?例如:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'
Run Code Online (Sandbox Code Playgroud)

我想我有点期待的是一种统计方法,它给出了前两个是位置的一定程度的信心.最后一个可能需要一个启发式来抓取"%s,%s",然后使用相同的技术.我特意寻找那些不太依赖命题'in'的方法,因为它不是一个完全明确或一致的位置指示器.

有人能指出方法,论文或现有的公用事业吗?谢谢!

eal*_*ent 8

您描述的问题通常称为地理查询解析或更一般地称为地理信息检索.

最近在CLEF 2007(http://www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm)上完成了这项任务.获胜团队使用基于规则的语法,这类似于您可能不想要的语法.www2009上的另一篇论文讨论了GeoParser:http://www2009.eprints.org/239/ .

在CIKM 2007上还有一些关于地理信息检索的论文:http://www.geo.unizh.ch/~rsp/gir07/accepted.html

我不知道有任何开源软件可以做到这一点,但它可能被捆绑到像Lemur这样的搜索引擎中.