标签: search

Lucene得分结果

在Lucene中,如果您有多个索引,每个索引只覆盖一个分区.为什么不同索引上的相同搜索会返回不同分数的结果?不同服务器的结果完全匹配.

即如果我搜索:

  • 姓名 - 约翰史密斯
  • DOB - 11/11/1934

分区0将返回0.345的分数

分区1将返回0.337的分数

两者都完全匹配名称和DOB.

lucene search

41
推荐指数
3
解决办法
3516
查看次数

如何从subversion服务器显示存储库列表

我正在寻找一种搜索整个subversion服务器的方法.

我已经在存储库中搜索了一个难题.现在我需要为每个存储库执行此操作.

更新:

我必须从一些unix shell脚本(perl,bash等)访问此列表

svn version-control search

41
推荐指数
3
解决办法
13万
查看次数

搜索R包的最佳方法是什么?

相关问题

如何搜索r材料

我认为R社区被吸引到基于标签的服务(如StackOverflow)的部分原因是R上的信息从根本上很难在网上找到.像RSeek这样的服务让这个问题稍微减轻了一些,但是,我经常发现搜索结果分散了.

具体来说,我常常很好奇是否存在R包以满足我所面临的特定需求.RSeek对于查找包文档很有用,但不适用于发现新包 - 而且R包管理器的用处更少.因此,搜索包的最佳做法是什么?也就是说,当我意识到我需要我当前的R套装不能满足时,在自己创建功能之前,我想搜索一个能满足需要的软件包.什么是最好的方法?

search r

40
推荐指数
3
解决办法
2万
查看次数

如何在Vim中的目录中递归搜索和替换?

我发现了Vim的替代命令......

:%s/replaceme/replacement/gi
Run Code Online (Sandbox Code Playgroud)

和vimgrep ......

:vimgrep  /findme/gj  project/**/*.rb
Run Code Online (Sandbox Code Playgroud)

有没有办法将它们组合起来,以便在目录下的所有文件中进行替换?

vim recursion search

40
推荐指数
5
解决办法
2万
查看次数

MySQL find_in_set有多个搜索字符串

我发现find_in_set只搜索一个字符串: -

find_in_set('a', 'a,b,c,d')
Run Code Online (Sandbox Code Playgroud)

在上面的示例中,'a'是用于搜索的唯一字符串.

有没有办法使用find_in_set类型的功能并通过多个字符串搜索,如: -

find_in_set('a,b,c', 'a,b,c,d')
Run Code Online (Sandbox Code Playgroud)

在上面的例子中,我想通过三个字符串'a,b,c'进行搜索.

我看到的一种方法是使用OR

find_in_set('a', 'a,b,c,d') OR find_in_set('b', 'a,b,c,d') OR find_in_set('b', 'a,b,c,d')
Run Code Online (Sandbox Code Playgroud)

还有其他方法吗?

mysql search

40
推荐指数
2
解决办法
5万
查看次数

如何有效地使用grep?

我有大量的小文件要搜索.我一直在寻找一个好的事实上的多线程版本,grep但找不到任何东西.如何提高我对grep的使用?截至目前我这样做:

grep -R "string" >> Strings
Run Code Online (Sandbox Code Playgroud)

unix linux search grep text

40
推荐指数
1
解决办法
2万
查看次数

使用Vim中的quickfix列表进行搜索和替换

到目前为止,我总是使用EasyGrep来替换多个文件中的文本.不幸的是,当项目变大时,它会很慢.有一点看起来非常快的是ggrep of fugitive.vim只搜索我的版本控制文件.所有结果也存储在quickfix列表中.

如何使用Ggrep的结果对所有找到的文件进行简单替换?是否有可能%s/foo/bar/cg在quickfix列表中的所有文件上使用或有更好的方法?

vim search replace

40
推荐指数
4
解决办法
1万
查看次数

在大型文本文件中搜索字符串 - 在python中分析各种方法

这个问题已被多次询问.花了一些时间阅读答案后,我做了一些快速分析,试用了前面提到的各种方法......

  • 我有一个600 MB的文件,有600 行字符串(来自DMOZ项目的类别路径).
  • 每行的条目都是唯一的.
  • 我想加载文件一次继续搜索数据中的匹配项

我在下面尝试的三种方法列出了加载文件所花费的时间,在任务管理器中搜索负匹配和内存使用的时间


1) set :
    (i)  data   = set(f.read().splitlines())
    (ii) result = search_str in data   
Run Code Online (Sandbox Code Playgroud)

加载时间〜10s,搜索时间~0.0s,内存使用量~1.2GB


2) list :
    (i)  data   = f.read().splitlines()
    (ii) result = search_str in data
Run Code Online (Sandbox Code Playgroud)

加载时间~6s,搜索时间~0.36s,内存使用量~1.2GB


3) mmap :
    (i)  data   = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ)
    (ii) result = data.find(search_str)
Run Code Online (Sandbox Code Playgroud)

加载时间〜0s,搜索时间~5.4s,内存使用量~NA


4) Hash lookup (using code from @alienhard below):   
Run Code Online (Sandbox Code Playgroud)

加载时间〜65s,搜索时间~0.0s,内存使用量~250MB


5) File search (using code from @EOL below):   
   with open('input.txt') …
Run Code Online (Sandbox Code Playgroud)

python performance search profiling large-files

40
推荐指数
3
解决办法
3万
查看次数

VIM:仅在特定行号之间搜索?

我知道使用Vim的替换命令可以指定一系列行:

:12,24s/search/replace
Run Code Online (Sandbox Code Playgroud)

我希望能够指定具有正常搜索的范围.就像是

:12,24/search
Run Code Online (Sandbox Code Playgroud)

由于这似乎不起作用(至少在我的Vim配置上),有人知道如何实现这一点吗?

谢谢.

vim search

39
推荐指数
5
解决办法
2万
查看次数

Numpy:对于一个数组中的每个元素,在另一个数组中查找索引

我有两个一维数组,x和y,一个比另一个小.我试图在x中找到y的每个元素的索引.

我发现了两种天真的方法,第一种是缓慢的,第二种是内存密集型.

缓慢的方式

indices= []
for iy in y:
    indices += np.where(x==iy)[0][0]
Run Code Online (Sandbox Code Playgroud)

记忆猪

xe = np.outer([1,]*len(x), y)
ye = np.outer(x, [1,]*len(y))
junk, indices = np.where(np.equal(xe, ye))
Run Code Online (Sandbox Code Playgroud)

有更快的方式或更少的内存密集型方法吗?理想情况下,搜索将利用这样一个事实,即我们在列表中搜索的不是一件事,而是很多事情,因此稍微更适合并行化.如果您不假设y的每个元素实际上都在x中,则奖励积分.

python arrays indexing search numpy

39
推荐指数
6
解决办法
3万
查看次数