小编Adr*_*ler的帖子

Elasticsearch在URL主机名上聚合

我正在使用包含url的字段索引文档:

[
    'myUrlField' => 'http://google.com/foo/bar'
]
Run Code Online (Sandbox Code Playgroud)

现在我想从弹性搜索中获得的是url字段上的聚合.

curl -XGET 'http://localhost:9200/myIndex/_search?pretty' -d '{
  "facets": {
    "groupByMyUrlField": {
      "terms": {
        "field": "myUrlField"
      }
    }
  }
}'
Run Code Online (Sandbox Code Playgroud)

这是一切都很好,但默认分析仪的标记化领域,这样的网址的每一部分是一个道理,所以我得到安打http,google.com,foobar.但基本上我只对网址的主机名感兴趣google.com.

我可以使用构面按特定标记分组吗?

"field": "myUrlField.0"
Run Code Online (Sandbox Code Playgroud)

或类似的东西?

查询"not_analyzed"索引也不好,因为我想按主机名分组,而不是按唯一网址分组.

希望能够在elasticsearch中执行此操作,而不是在我的客户端代码中执行此操作.谢谢

tokenize elasticsearch

4
推荐指数
1
解决办法
2475
查看次数

$('.classname')和$ .find('.classname')之间有什么区别

有时$('.classname')$.find('.classname')给出了不同的结果.想知道两者之间有什么区别.

javascript jquery jquery-selectors

3
推荐指数
1
解决办法
321
查看次数

PHP垃圾收集和内存优化

我正在做一些 PHP 内存基准测试,我想知道是否有一种方法可以优化垃圾收集器以减少内存消耗(因为它在其他语言中是可能的,例如 JAVA)。

我在 php.ini 中只发现了三个与 GC 相关的可自定义参数:session.gc_probability,session.gc_divisorsession.gc_maxlifetime. 这仅适用于会话,我没有对此进行基准测试。

到目前为止我知道的可能优化与代码相关,例如避免循环引用和通过调用强制垃圾收集循环gc_collect_cycles()(感谢这篇文章http://www.alexatnet.com/comment/86)。

有人知道 PHP 内存管理中的任何配置技巧或良好做法吗?

php memory benchmarking memory-management

2
推荐指数
1
解决办法
2022
查看次数

使用把手或降价来输出模型属性

我有一个模型,它定义了一个带有markdown或html内容的属性.

我想知道是否使用markdown JS库输出信息或使用把手在视图中生成html输出.

任何建议,例子将不胜感激.

javascript markdown ember.js

2
推荐指数
2
解决办法
2442
查看次数

如何在骨干网中设置自定义基础href?

我有一个html包装器应用程序从ipad文件存储加载所有js,css和图像.因此,UIWebView加载了不同的基本href.

骨干数据的加载应该正常进入服务器.有没有办法在骨干网中设置基本href - 因此骨干对服务器而言是实际的,而不是文件存储?也许以全球方式?

javascript backbone.js

0
推荐指数
1
解决办法
1776
查看次数