查找具有不同结构的文件的 grok 模式

Question

查找具有不同结构的文件的 grok 模式

Sur*_*ian 3 logstash logstash-grok elastic-stack

我有一个日志文件，其中并非所有行都采用相同的格式。如何找到此类文件的正确 grok 模式。

[15:37:20:030|1] [TdmUtil.c: 1534:fnTDM_LoadLocalFoo] F_LAA       : 1
[15:37:20:032|1] [TdmUtil.c: 1281:fnTDM_GetPreDef]  pdeGetData : MAX_IRAT_NBR_PER_SERVED_CELL_SYS = 256
[15:37:20:091|1] [TdmUtil.c:  293:fnTDM_PrtIndexKey] fnTDM_GetIndexKeyNum Error!!

Run Code Online (Sandbox Code Playgroud)

这样，很少有行采用 line1 的格式，少数行采用 line2 的格式，依此类推。我可以为每一行编写一个 grok 模式，但我不知道如何组合它们。有什么办法可以解决这个问题吗？

Answer 1

ela*_*nai 13

我已经为你准备了一些东西。但在与您分享之前，我建议您使用在线 GROK 调试器来编写您的 GROK 模式（如果您在开发工具 -> GROK 调试器下使用它，Kibana 中有 1 个）。您还应该查看可用的 GROK 模式。

我看到所有 3 行都有相同的前缀，[time|num] [class: line number: function name] log text我为此创建了一个 GROK 模式。如果你想进一步分解，log text你可以通过取消注释第二场比赛text并提供所需的 grok 模式来实现。

注意：您可以根据需要添加任意数量的match部分，但请注意，它会尝试对所有部分运行匹配。尝试使用if else语句来导航高复杂性 - 通常不需要它。

input {
    file {
        path => "C:/work/elastic/logstash-6.5.0/config/test.txt"
        start_position => "beginning"
        codec => multiline {
            pattern => "^\[%{TIME}\|"
            negate => true
            what => "previous"
        }
        type => "whatever"
    }
}
filter {
    if [type] == "whatever" {
        grok {
            break_on_match => false
            match => { "message" => "^\[%{TIME:time}\|%{NUMBER:num}\]%{SPACE}\[%{DATA:class}:%{SPACE}%{NUMBER:linenumber:int}:%{DATA:function}\]%{GREEDYDATA:text}$"}
            #match => { "text" => ""}
        }
    }
}

output {
    elasticsearch {
        hosts => ["http://localhost:9200"]
        index => "test"
    }
}

Run Code Online (Sandbox Code Playgroud)

上述配置文件将为您提供 Kibana 中的以下字段：

归档时间：	5 年，9 月前
查看次数：	1915 次
最近记录：	5 年，9 月前