我的生产环境使用quartz 2.1.4运行java调度程序作业.在具有4台机器的weblogic集群服务器上,只有一个调度作业通常在一个集群节点(节点1)执行几个月,但是节点2突然发现节点1在昨晚接管执行作业时失败.实际上,节点1没有错误(根据服务器,网络,数据库,应用程序日志),此事件导致由于2进程并发执行而创建的重复消息.
石英检测节点失败的机制是什么?通过ping扫描,或通过UCP广播心跳ping,还是数据库响应时间等?有什么配置吗?
我已阅读石英配置指南 http://quartz-scheduler.org/documentation/quartz-2.1.x/configuration/ConfigJDBCJobStoreClustering ,但没有答案.
我正在使用JDBCJobstore.在详细检查之后,我们发现有一个数据库(Oracle)语句执行异常长(从5秒到30秒).事件发生在这段时间.你觉得它有关系吗?
我的配置是
`org.quartz.threadPool.threadCount = 10
org.quartz.threadPool.threadPriority = 5
org.quartz.jobStore.misfireThreshold = 10000
org.quartz.jobStore.class = org.quartz.impl.jdbcjobstore.JobStoreTX`
有人有此信息吗?谢谢.