如何分析java线程转储?

Leo*_*rdo 95 java multithreading thread-dump

我试图更多地了解java,尤其是关于内存管理和线程.出于这个原因,我最近发现有兴趣查看线程转储.

以下是使用VisualVM(一种用于java的内置工具)从Web应用程序中获取的几行:

"Finalizer" daemon prio=8 tid=0x02b3d000 nid=0x898 in Object.wait() [0x02d0f000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x27ef0288> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118)
    - locked <0x27ef0288> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:134)
    at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:159)

   Locked ownable synchronizers:
    - None

"Reference Handler" daemon prio=10 tid=0x02b3b800 nid=0x494 in Object.wait() [0x02cbf000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x27ef0310> (a java.lang.ref.Reference$Lock)
    at java.lang.Object.wait(Object.java:485)
    at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:116)
    - locked <0x27ef0310> (a java.lang.ref.Reference$Lock)
Run Code Online (Sandbox Code Playgroud)

首先,我对一些变量名称有疑问:

  • tid和nid是什么意思?
  • Object.wait之后的平方括号中的数字是多少?

然后为堆栈跟踪本身:

  • 是什么意思等待<.....>(一个java.lang ....)<..>中的数字是什么
  • 是什么意思锁定<.....>(一个java.lang ....)同样的问题,<...>中的内容

我认为锁定这个词在某种程度上与等待条件有关,但是,我错了.事实上,我想知道为什么锁定重复三次,但线程处于可运行状态,如同一个转储中所示:

"Thread-0" prio=6 tid=0x02ee3800 nid=0xc1c runnable [0x03eaf000]
   java.lang.Thread.State: RUNNABLE
    at java.io.FileInputStream.readBytes(Native Method)
    at java.io.FileInputStream.read(FileInputStream.java:199)
    at java.io.BufferedInputStream.read1(BufferedInputStream.java:256)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:317)
    - locked <0x23963378> (a java.io.BufferedInputStream)
    at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:264)
    at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:306)
    at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:158)
    - locked <0x23968450> (a java.io.InputStreamReader)
    at java.io.InputStreamReader.read(InputStreamReader.java:167)
    at java.io.BufferedReader.fill(BufferedReader.java:136)
    at java.io.BufferedReader.readLine(BufferedReader.java:299)
    - locked <0x23968450> (a java.io.InputStreamReader)
    at java.io.BufferedReader.readLine(BufferedReader.java:362)
    at org.codehaus.plexus.util.cli.StreamPumper.run(StreamPumper.java:145)
Run Code Online (Sandbox Code Playgroud)

最后,这是最糟糕的:

"CompilerThread0" daemon prio=10 tid=0x02b81000 nid=0x698 waiting on condition [0x00000000]
   java.lang.Thread.State: RUNNABLE
Run Code Online (Sandbox Code Playgroud)

该线程处于可运行状态,但它正在等待条件.什么条件和什么是0x00000?

为什么堆栈跟踪如此短暂而没有任何线程类的证据?

如果你能回答我的所有问题,我将非常感激.

谢谢

Jam*_*ard 108

TID是thead id,NID是:本机线程ID.此ID高度依赖于平台.它是jstack线程转储中的NID.在Windows上,它只是进程中的操作系统级线程ID.在Linux和Solaris上,它是线程的PID(反过来又是一个轻量级的过程).在Mac OS X上,它被称为本机pthread_t值.

转到此链接:Java级别的线程ID:有关这两个术语的定义和进一步说明.

在IBM的网站上,我找到了这个链接:如何解释线程转储.更详细地介绍了这一点:

它解释了等待意味着什么:锁定阻止多个实体访问共享资源.Java™中的每个对象都有一个关联的锁(通过使用同步块或方法获得).对于JVM,线程竞争JVM中的各种资源并锁定Java对象.

然后,它将监视器描述为一种特殊的锁定机制,在JVM中使用它以允许线程之间的灵活同步.出于本节的目的,请交替阅读术语监视器和锁定.

然后它进一步:

为避免在每个对象上都有监视器,JVM通常使用类或方法块中的标志来指示该项是否已锁定.大多数情况下,一段代码会在没有争用的情况下传输一些锁定的部分.因此,监护人标志足以保护这段代码.这称为平板显示器.但是,如果另一个线程想要访问某些已锁定的代码,则会发生真正的争用.JVM现在必须创建(或膨胀)监视器对象以保存第二个线程,并安排信号机制来协调对代码段的访问.此监视器现在称为充气监视器.

以下是对线程转储中的内容进行更深入的解释.Java线程由操作系统的本机线程实现.每个线程用粗体表示,例如:

"Thread-1"(TID:0x9017A0,sys_thread_t:0x23EAC8,状态:R,本机ID:0x6E4)prio = 5

*以下6个项目解释了这一点,因为我从示例中匹配它们,括号[]中的值:

  1. name [ Thread-1 ],
  2. 标识符[ 0x9017A0 ],
  3. JVM数据结构地址[ 0x23EAC8 ],
  4. 现状[ R ],
  5. 本机线程标识符[ 0x6E4 ],
  6. 和优先[ 5 ].

"等待"似乎是与jvm本身相关联的守护程序线程,而不是应用程序线程perse.当你得到一个"在Object.wait()"时,这意味着守护程序线程,这里的"终结器"正在等待关于对象锁定的通知,在这种情况下,它会显示它正在等待的通知:" - 等待<0x27ef0288>(一个java.lang.ref.ReferenceQueue $ Lock)"

ReferenceQueue的定义是:引用队列,在检测到适当的可达性更改后,垃圾收集器将已注册的引用对象附加到该引用队列.

终结器线程运行,因此垃圾收集操作以清理与对象关联的资源.如果我正确地看到它,终结器无法获得对此对象的锁定:java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118)因为java对象正在运行一个方法,所以终结器线程是锁定,直到该对象完成它的当前任务.

此外,终结器不只是寻求回收内存,它比清理资源更复杂.我需要对它进行更多的研究,但是如果你有文件打开,套接字等......与对象方法有关,那么终结器也可以解决这些问题.

在线程转储中的Object.wait之后的平方括号中的数字是多少?

它是内存中指向线程的指针.这是一个更详细的描述:

C.4.1线程信息

线程部分的第一部分显示了引发致命错误的线程,如下所示:

Current thread (0x0805ac88):  JavaThread "main" [_thread_in_native, id=21139]
                    |             |         |            |          +-- ID
                    |             |         |            +------------- state
                    |             |         +-------------------------- name
                    |             +------------------------------------ type
                    +-------------------------------------------------- pointer
Run Code Online (Sandbox Code Playgroud)

线程指针是指向Java VM内部线程结构的指针.除非您正在调试实时Java VM或核心文件,否则通常没有意义.

最后的描述来自:使用HotSpot VM的Java SE 6故障排除指南

以下是有关线程转储的更多链接:


Jer*_*emy 11

继@James Drinkard的优秀答案:

请注意,根据底层实现,在本机方法中阻塞的线程的java.lang.Thread.State可能会被报告为RUNNABLE,其中A thread in the runnable state is executing in the Java virtual machine but it may be waiting for other resources from the operating system such as processor.

事实证明,此描述还包括在诸如轮询或读取操作的OS调用中被阻止 - 可能是因为无法保证JVM可以知道本机方法调用何时在OS级别被阻止.

我所看到的许多关于JVM线程转储的讨论要么完全忽略了这种可能性,要么在没有考虑其影响的情况下轻率地略过它 - 尤其是监控工具可能会混淆地报告几个这样的线程正在"运行",而且他们都在100%运行.