Java定期挂起futex和非常低的IO输出

bfo*_*vdr 14 java io futex huge-pages

目前我的应用程序在IO中定期被阻止,输出非常低.我使用一些命令来跟踪进程.

通过使用jstack我发现该应用程序挂在FileOutputStream.writeBytes.

通过使用strace -f -c -p pid收集系统调用信息,我发现了.对于正常情况,它有futex和write syscalls.但是当它变得不正常时,只有futex系统调用.该应用程序一直在调用futex,但都失败并抛出ETIMEDOUT,就像这样:

<futex resumed>  =-1 ETIMEDOUT (Connecton timed out)
futex(Ox7f823, FUTEX_WAKE_PRIVATE,1)=0
futex(Ox7f824, FUTEX_WAIT_BITSET_PRIVATE|FUTEX_CLOCK_REALTIME) =-1<unfinished>
<futex resumed>  =-1 ETIMEDOUT (Connecton timed out)
futex(Ox7f823, FUTEX_WAKE_PRIVATE,1)=0
futex(Ox7f824, FUTEX_WAIT_BITSET_PRIVATE|FUTEX_CLOCK_REALTIME) =-1<unfinished>
Run Code Online (Sandbox Code Playgroud)

此问题会定期发生,并持续数小时或数小时,并再次恢复正常.

顺便说一句,当在IO中被阻塞时,echo 3>/proc/sys/vm/drop_caches总是使它暂时正常.我用Google搜索并找到了一些类似的proleam,如下所示.

  1. 闰秒.不起作用,我们的系统的ntpd被停止了.
  2. 透明的巨页错误.https://bugzilla.redhat.com/show_bug.cgi?id=879801 这与我的问题很相似,但是我的khugepaged进程是正常的,负载总是接近于零.escipally drop_caches也适用于我的应用程序.我的系统也是多核和大内存.它对我不起作用.所以任何人遇到同样的问题或熟悉这个问题?

有关我的系统的一些信息.操作系统:Redhat 6.1,核心版本2.6.31

JDK:1.7.0_05

CPU:X5650,24个

内存:24GB和48GB

Guy*_*ela 3

也许是 futex_wait() 中的内核错误?

您可以在这里阅读: https ://groups.google.com/forum/#!topic/mechanical-sympathy/QbmpZxp6C64