我有超过100个CSV文件,其中有10000行,我正在编制索引.然后查询拼写是类似的拼写.虽然做这个索引非常慢.
我找到了一些很好的解决方案
主从索引和从属用于查询的主从属.如何更快地索引Solr中的记录(而不是影响ColdFusion Web服务器)?两个JVM?
使用Tri-Range http://www.lucidimagination.com/blog/2009/05/13/exploring-lucene-and-solrs-trierange-capabilities/
我知道这两种解决方案不同我想要一些应该优先考虑的评论吗?第二种解决方案是否适合我的问题?如果我的拼写检查问题有更多的解决方案.
提前致谢
我正在使用文本文件.我想用Java实现一个搜索算法.我有一个我需要搜索的文本文件.
如果我想找到一个单词,我可以通过将所有文本放入hashmap并存储每个单词的出现来实现.但是,如果我想搜索两个字符串(或者可能更多),是否有任何算法?我应该以两对方式散列字符串吗?
我有一个字符串
"This is a big sentence . ! ? ! but I have to remove the space ."
Run Code Online (Sandbox Code Playgroud)
在这句话中,我想删除标点符号之前的所有空格,并且应该成为
"This is a big sentence.!?! but I have to remove the space."
Run Code Online (Sandbox Code Playgroud)
我试图使用"\p{Punct}"但不能替换字符串.