对于那些不知道Solr是什么的人来说,它是Apache Lucene项目的一部分.它是在Tomcat等容器中运行的服务器.Solr托管Lucene索引并提供"类似REST"的接口,以通过HTTP更新和查询索引.
" 入门 "教程讨论了如何启动Solr服务器java -jar start.jar
,但这只是为了让Solr服务器运行.这就像启动一个MySQL服务器的实例 - 在你可以查询它之前是必要的,但是这个步骤本身不会用数据填充它或者让它提供任何结果.
本教程继续展示将文档发布到Solr服务器的示例:
user:~/solr/example/exampledocs$ java -jar post.jar solr.xml monitor.xml
Run Code Online (Sandbox Code Playgroud)
该示例发布了两个文档,solr.xml
并monitor.xml
进行索引.您不必使用他们的post.jar
示例 - 因为Solr支持HTTP,您应该能够使用任何HTTP客户端,例如curl.
要以这种方式索引SQL查询的整个结果,您必须编写一个脚本来循环遍历结果并逐行将数据发布到Solr,但这可能会非常耗时,因此需要单独的HTTP POST请求每行数据.
我猜测更快的方法是使用Solr支持CSV格式的批量数据.有关示例,请参见http://wiki.apache.org/solr/UpdateCSV.
归档时间: |
|
查看次数: |
6296 次 |
最近记录: |