Lucene得分结果

在Lucene中,如果您有多个索引,每个索引只覆盖一个分区.为什么不同索引上的相同搜索会返回不同分数的结果？不同服务器的结果完全匹配.

即如果我搜索:

姓名 - 约翰史密斯
DOB - 11/11/1934

分区0将返回0.345的分数

分区1将返回0.337的分数

两者都完全匹配名称和DOB.

lucene search

Ste*_*dry

2016 12-20

41
推荐指数

3
解决办法

3516
查看次数

如何从subversion服务器显示存储库列表

我正在寻找一种搜索整个subversion服务器的方法.

我已经在存储库中搜索了一个难题.现在我需要为每个存储库执行此操作.

更新:

我必须从一些unix shell脚本(perl,bash等)访问此列表

svn version-control search

lam*_*cro

2017 05-23

41
推荐指数

3
解决办法

13万
查看次数

搜索R包的最佳方法是什么？

如何在Vim中的目录中递归搜索和替换？

我发现了Vim的替代命令......

:%s/replaceme/replacement/gi

Run Code Online (Sandbox Code Playgroud)

和vimgrep ......

:vimgrep  /findme/gj  project/**/*.rb

Run Code Online (Sandbox Code Playgroud)

有没有办法将它们组合起来,以便在目录下的所有文件中进行替换？

vim recursion search

Eth*_*han

2012 12-15

40
推荐指数

5
解决办法

2万
查看次数

MySQL find_in_set有多个搜索字符串

我发现find_in_set只搜索一个字符串: -

find_in_set('a', 'a,b,c,d')

Run Code Online (Sandbox Code Playgroud)

在上面的示例中,'a'是用于搜索的唯一字符串.

有没有办法使用find_in_set类型的功能并通过多个字符串搜索,如: -

find_in_set('a,b,c', 'a,b,c,d')

Run Code Online (Sandbox Code Playgroud)

在上面的例子中,我想通过三个字符串'a,b,c'进行搜索.

我看到的一种方法是使用OR

find_in_set('a', 'a,b,c,d') OR find_in_set('b', 'a,b,c,d') OR find_in_set('b', 'a,b,c,d')

Run Code Online (Sandbox Code Playgroud)

还有其他方法吗？

mysql search

Muk*_*ain

2011 02-26

40
推荐指数

2
解决办法

5万
查看次数

如何有效地使用grep？

我有大量的小文件要搜索.我一直在寻找一个好的事实上的多线程版本,grep但找不到任何东西.如何提高我对grep的使用？截至目前我这样做:

grep -R "string" >> Strings

Run Code Online (Sandbox Code Playgroud)

unix linux search grep text

Leg*_*end

lucky-day

40
推荐指数

1
解决办法

2万
查看次数

使用Vim中的quickfix列表进行搜索和替换

到目前为止,我总是使用EasyGrep来替换多个文件中的文本.不幸的是,当项目变大时,它会很慢.有一点看起来非常快的是ggrep of fugitive.vim只搜索我的版本控制文件.所有结果也存储在quickfix列表中.

如何使用Ggrep的结果对所有找到的文件进行简单替换？是否有可能%s/foo/bar/cg在quickfix列表中的所有文件上使用或有更好的方法？

vim search replace

Zar*_*doz

lucky-day

40
推荐指数

4
解决办法

1万
查看次数

在大型文本文件中搜索字符串 - 在python中分析各种方法

这个问题已被多次询问.花了一些时间阅读答案后,我做了一些快速分析,试用了前面提到的各种方法......

我有一个600 MB的文件,有600 万行字符串(来自DMOZ项目的类别路径).

每行的条目都是唯一的.

我想加载文件一次并继续搜索数据中的匹配项

我在下面尝试的三种方法列出了加载文件所花费的时间,在任务管理器中搜索负匹配和内存使用的时间

1) set :
    (i)  data   = set(f.read().splitlines())
    (ii) result = search_str in data

Run Code Online (Sandbox Code Playgroud)

加载时间〜10s,搜索时间~0.0s,内存使用量~1.2GB

2) list :
    (i)  data   = f.read().splitlines()
    (ii) result = search_str in data

Run Code Online (Sandbox Code Playgroud)

加载时间~6s,搜索时间~0.36s,内存使用量~1.2GB

3) mmap :
    (i)  data   = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ)
    (ii) result = data.find(search_str)

Run Code Online (Sandbox Code Playgroud)

加载时间〜0s,搜索时间~5.4s,内存使用量~NA

4) Hash lookup (using code from @alienhard below):

Run Code Online (Sandbox Code Playgroud)

加载时间〜65s,搜索时间~0.0s,内存使用量~250MB

5) File search (using code from @EOL below):   
   with open('input.txt') …

Run Code Online (Sandbox Code Playgroud)

python performance search profiling large-files

use*_*ser

2011 06-06

40
推荐指数

3
解决办法

3万
查看次数

VIM:仅在特定行号之间搜索？

我知道使用Vim的替换命令可以指定一系列行:

:12,24s/search/replace

Run Code Online (Sandbox Code Playgroud)

我希望能够指定具有正常搜索的范围.就像是

:12,24/search

Run Code Online (Sandbox Code Playgroud)

由于这似乎不起作用(至少在我的Vim配置上),有人知道如何实现这一点吗？

谢谢.

vim search

Tho*_*mas

lucky-day

39
推荐指数

5
解决办法

2万
查看次数

Numpy:对于一个数组中的每个元素,在另一个数组中查找索引

我有两个一维数组,x和y,一个比另一个小.我试图在x中找到y的每个元素的索引.

我发现了两种天真的方法,第一种是缓慢的,第二种是内存密集型.

缓慢的方式

indices= []
for iy in y:
    indices += np.where(x==iy)[0][0]

Run Code Online (Sandbox Code Playgroud)

记忆猪

xe = np.outer([1,]*len(x), y)
ye = np.outer(x, [1,]*len(y))
junk, indices = np.where(np.equal(xe, ye))

Run Code Online (Sandbox Code Playgroud)

有更快的方式或更少的内存密集型方法吗？理想情况下,搜索将利用这样一个事实,即我们在列表中搜索的不是一件事,而是很多事情,因此稍微更适合并行化.如果您不假设y的每个元素实际上都在x中,则奖励积分.

python arrays indexing search numpy

Chr*_*ris

2015 08-08

39
推荐指数

6
解决办法

3万
查看次数

标签统计

search ×10

vim ×3

python ×2

arrays ×1

grep ×1

indexing ×1

large-files ×1

linux ×1

lucene ×1

mysql ×1

numpy ×1

performance ×1

profiling ×1

r ×1

recursion ×1

replace ×1

svn ×1

text ×1

unix ×1

version-control ×1

标签: search

Lucene得分结果

如何从subversion服务器显示存储库列表

更新:

搜索R包的最佳方法是什么？

相关问题

如何在Vim中的目录中递归搜索和替换？

MySQL find_in_set有多个搜索字符串

如何有效地使用grep？

使用Vim中的quickfix列表进行搜索和替换

在大型文本文件中搜索字符串 - 在python中分析各种方法

VIM:仅在特定行号之间搜索？

Numpy:对于一个数组中的每个元素,在另一个数组中查找索引

缓慢的方式

记忆猪

标签统计

标签: search

更新:

相关问题

缓慢的方式

记忆猪

标签 统计

标签统计