Logstash 未从 MySQL 读取新条目

Gma*_*man 4 mysql jdbc elasticsearch logstash logstash-configuration

我在 Windows 7 机器上本地安装了 Logstash 和 Elasticsearch。我在 Logstash 中安装了logstash-input-jdbc

我在 MySql 数据库中有数据,我使用 Logstash 将这些数据发送到 Elasticsearch,以便我可以生成一些报告。

执行此操作的 Logstash 配置文件。

input {
 jdbc {
   jdbc_driver_library => "C:/logstash/lib/mysql-connector-java-5.1.37-bin.jar"
   jdbc_driver_class => "com.mysql.jdbc.Driver"
   jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/test"
   jdbc_user => "root"
   jdbc_password => ""
   statement => "SELECT * FROM transport.audit"
   jdbc_paging_enabled => "true"
   jdbc_page_size => "50000"
}
}

output {
  elasticsearch {
    hosts => ["localhost:9200"]
    index => "transport-audit-%{+YYYY.mm.dd}"
}
}
Run Code Online (Sandbox Code Playgroud)

这有效,Logstash 在我运行时将数据发送到 Elasticsearch:

bin\logstash agent -f \logstash\conf\01_input.conf
Run Code Online (Sandbox Code Playgroud)

这是该命令的响应

io/console not supported; tty will not be manipulated
Default settings used: Filter workers: 4
Logstash startup completed
Logstash shutdown completed
Run Code Online (Sandbox Code Playgroud)

为什么,Logstash 会关闭吗?

当我检查 Elasticsearch 时,数据就在那里,如果我再次运行该命令,数据将被重新索引(复制)。

在此处输入图片说明

这是Mysql数据:

在此处输入图片说明

我正在尝试做的事情(实现):

我希望 Logstash 运行并侦听审计表上的新条目,并且只索引该数据(当新的审计条目输入到表中时,Logstash 会知道并将该条目发送到 Elasticsearch。

另外,为什么当我运行该命令时 Logstash 会停止,它不应该运行吗?我是 Logstash 和 Elasticsearch 的新手。

谢谢

G

我也在Elastic 论坛上发布了同样的问题,如果我得到答案,我会在这里发布以帮助其他人。

Val*_*Val 5

默认情况下,logstash-input-jdbc 插件将运行您的 SELECT 语句一次然后退出。您可以通过在配置中添加带有 cron 表达式的schedule参数来更改此行为,如下所示:

input {
 jdbc {
   jdbc_driver_library => "C:/logstash/lib/mysql-connector-java-5.1.37-bin.jar"
   jdbc_driver_class => "com.mysql.jdbc.Driver"
   jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/test"
   jdbc_user => "root"
   jdbc_password => ""
   statement => "SELECT * FROM transport.audit"
   schedule => "* * * * *"               <----- add this line
   jdbc_paging_enabled => "true"
   jdbc_page_size => "50000"
 }
}
Run Code Online (Sandbox Code Playgroud)

结果是 SELECT 语句现在每分钟运行一次。

如果您的 MySQL 表中有一个日期字段(但似乎并非如此),您还可以使用预定义的sql_last_start参数,以免每次运行时都重新索引所有记录。该参数可以在您的查询中使用,如下所示:

   statement => "SELECT * FROM transport.audit WHERE your_date_field >= :sql_last_start"
Run Code Online (Sandbox Code Playgroud)