Ton*_*dig 4 logstash logstash-configuration
我试图让logstash解析来自我的ELB日志文件的HTTP get请求中的键值对.
请求字段看起来像
http://aaa.bbb/get?a=1&b=2
我想那里是一个领域a,并b在上面的日志行,而我无法计算出来.
我的logstash conf(为清晰起见而格式化)低于该值不会加载任何其他关键字段.我假设我需要拆分URI的地址部分,但还没想出来.
input {
file {
path => "/home/ubuntu/logs/**/*.log"
type => "elb"
start_position => "beginning"
sincedb_path => "log_sincedb"
}
}
filter {
if [type] == "elb" {
grok {
match => [ "message", "%{TIMESTAMP_ISO8601:timestamp}
%{NOTSPACE:loadbalancer} %{IP:client_ip}:%{NUMBER:client_port:int}
%{IP:backend_ip}:%{NUMBER:backend_port:int}
%{NUMBER:request_processing_time:float}
%{NUMBER:backend_processing_time:float}
%{NUMBER:response_processing_time:float}
%{NUMBER:elb_status_code:int}
%{NUMBER:backend_status_code:int}
%{NUMBER:received_bytes:int} %{NUMBER:sent_bytes:int}
%{QS:request}" ]
}
date {
match => [ "timestamp", "ISO8601" ]
}
kv {
field_split => "&?"
source => "request"
exclude_keys => ["callback"]
}
}
}
output {
elasticsearch { host => localhost }
}
Run Code Online (Sandbox Code Playgroud)
kv将采用URL并拆分params.此配置有效:
input {
stdin { }
}
filter {
mutate {
add_field => { "request" => "http://aaa.bbb/get?a=1&b=2" }
}
kv {
field_split => "&?"
source => "request"
}
}
output {
stdout {
codec => rubydebug
}
}
Run Code Online (Sandbox Code Playgroud)
stdout显示:
{
"request" => "http://aaa.bbb/get?a=1&b=2",
"a" => "1",
"b" => "2"
}
Run Code Online (Sandbox Code Playgroud)
也就是说,我鼓励您创建自己的默认URI模式版本,以便它们设置字段.然后,您可以将查询字符串字段传递给kv.这样更干净.
更新:
对于"制作自己的模式",我打算采用现有模式并根据需要进行修改.在logstash 1.4中,安装它们就像将它们放在'patterns'目录的新文件中一样简单; 我还不知道> 1.4的模式.
MY_URIPATHPARAM %{URIPATH}(?:%{URIPARAM:myuriparams})?
MY_URI %{URIPROTO}://(?:%{USER}(?::[^@]*)?@)?(?:%{URIHOST})?(?:%{MY_URIPATHPARAM})?
Run Code Online (Sandbox Code Playgroud)
然后你可以在你的grok {}模式中使用MY_URI,它会创建一个名为myuriparams的字段,你可以输入到kv {}.
| 归档时间: |
|
| 查看次数: |
3293 次 |
| 最近记录: |