我必须在参考地址(PostGreSQL 数据库中大约有 3000 万个)和包含其他地址的文件(每个月有许多文件,每个文件包含数百万个地址)之间进行配对。
我已经设法在 SolR 中导入参考地址,搜索引擎很棒。有没有一种方法可以创建一个处理程序或插件来非常快速地为文件的每一行进行配对?
我不能使用 REST API 在 SolR 上执行数百万个 http 请求,这太慢了。我只想将结果作为“id 配对”,例如,如果文件“somefile.csv”的 ID 17 地址与引用地址的 IDS 36、452 和 13456 匹配,这就是我需要检索的全部内容,我可以询问有关更多信息的数据库稍后。
我想用 Java 来做,但任何其他语言也是可能的。