是否有可能获得每个突出显示的片段的字符位置?我需要将突出显示的文本与源文档相匹配,并且使字符位置成为可能.
例如:
curl "localhost:9200/twitter/tweet/_search?pretty=true" -d '{
"query": {
"query_string": {
"query": "foo"
}
},
"highlight": {
"fields": {
"message": {"number_of_fragments": 20}
}
}
}'
Run Code Online (Sandbox Code Playgroud)
返回这个高潮:
"highlight" : {
"message" : [ "some <em>foo</em> text" ]
}
Run Code Online (Sandbox Code Playgroud)
如果匹配文档中的字段消息是:
"Here is some foo text"
Run Code Online (Sandbox Code Playgroud)
有没有办法知道片段从char 8开始到匹配字段的char 21结束?
知道匹配令牌的开始/结束偏移对我来说也是好事 - 也许有一种方法可以使用script_fields访问该信息?(此问题显示如何获取令牌,但不显示偏移量).
字段"消息"具有:
"term_vector" : "with_positions_offsets",
"index_options" : "positions"
Run Code Online (Sandbox Code Playgroud)