简介

如果我们在程序中遇到线程死锁的时候,该怎么去解决呢?

本文将会从一个实际的例子出发,一步一步的揭开java问题解决的面纱。

死锁的代码

写过java多线程程序的人应该都知道,多线程中一个很重要的事情就是状态的同步,但是在状态同步的过程中,一不小心就有可能会导致死锁的问题。

一个最简单的死锁情况就是thread1占有资源1,然后又要去获取资源2. 而thread2占有资源2,又要去获取资源1的情况。

举个具体的例子:

public class TestDeadLock {
public static Object lock1= new Object();
public static Object lock2= new Object();
public static void main(String[] args) {
Runnable runnable1= ()-> {
System.out.println("in lock1");
synchronized(lock1){
System.out.println("Lock1 lock obj1");
try {
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized(lock2){
System.out.println("Lock1 lock obj2");
}
}
}; Runnable runnable2= ()-> {
System.out.println("in lock2");
synchronized(lock2){
System.out.println("Lock2 lock obj2");
try {
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized(lock1){
System.out.println("Lock2 lock obj1");
}
}
}; Thread a = new Thread(runnable1);
Thread b = new Thread(runnable2);
a.start();
b.start();
}
}

我们运行上面的代码:

in lock1
Lock1 lock obj1
in lock2
Lock2 lock obj2

发送了锁循环等待的情况,程序执行不下去了,发送了死锁。

control+break命令

在代码很简单的情况下,我们很容易就能分析出来死锁的原因,但是如果是在一个非常庞大的线上项目的时候,分析代码就没有那么容易了。

怎么做呢?

今天教给大家一个方法,使用control+break命令。

control+break在linux表示的是Control+backslash,而在Windows下面就是Control+Break按钮。

当然,还有一个更加通用的就是使用:

kill -QUIT pid命令。

我们用jps命令获取到执行java程序的进程id,然后执行kill -QUIT命令。

执行完毕,我们会发现运行的java进程会输出一些额外的日志,这些额外的日志就是我们找出死锁的关键因素。

注意,这个kill命令并不会终止程序的运行。

输出的内容比较多,我们一部分一部分的讲解。

Full thread dump

日志的第一部分就是Full thread dump,包含了JVM中的所有线程的状态信息。

我们看一下我们代码中的两个关键线程信息:

"Thread-0" #13 prio=5 os_prio=31 cpu=4.86ms elapsed=230.16s tid=0x00007fc926061800 nid=0x6403 waiting for monitor entry  [0x0000700008d6a000]
java.lang.Thread.State: BLOCKED (on object monitor)
at com.flydean.TestDeadLock.lambda$main$0(TestDeadLock.java:21)
- waiting to lock <0x0000000787e868f0> (a java.lang.Object)
- locked <0x0000000787e868e0> (a java.lang.Object)
at com.flydean.TestDeadLock$$Lambda$14/0x0000000800b69840.run(Unknown Source)
at java.lang.Thread.run(java.base@14.0.1/Thread.java:832) "Thread-1" #14 prio=5 os_prio=31 cpu=4.32ms elapsed=230.16s tid=0x00007fc924869800 nid=0x6603 waiting for monitor entry [0x0000700008e6d000]
java.lang.Thread.State: BLOCKED (on object monitor)
at com.flydean.TestDeadLock.lambda$main$1(TestDeadLock.java:36)
- waiting to lock <0x0000000787e868e0> (a java.lang.Object)
- locked <0x0000000787e868f0> (a java.lang.Object)
at com.flydean.TestDeadLock$$Lambda$15/0x0000000800b69c40.run(Unknown Source)
at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)

上面的输出列出了线程名字,线程的优先级,cpu时间,是否是daemon线程,线程ID,线程状态等有用的信息。

看到上面的输出,我们看到两个线程都是处于BLOCKED状态,都在等待object monitor。

还记得线程的几个状态吗? 我们再来复习一下。

死锁检测

接下来的部分就是我们最关心的死锁检测了。

Found one Java-level deadlock:
=============================
"Thread-0":
waiting to lock monitor 0x00007fc926807e00 (object 0x0000000787e868f0, a java.lang.Object),
which is held by "Thread-1" "Thread-1":
waiting to lock monitor 0x00007fc926807f00 (object 0x0000000787e868e0, a java.lang.Object),
which is held by "Thread-0" Java stack information for the threads listed above:
===================================================
"Thread-0":
at com.flydean.TestDeadLock.lambda$main$0(TestDeadLock.java:21)
- waiting to lock <0x0000000787e868f0> (a java.lang.Object)
- locked <0x0000000787e868e0> (a java.lang.Object)
at com.flydean.TestDeadLock$$Lambda$14/0x0000000800b69840.run(Unknown Source)
at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)
"Thread-1":
at com.flydean.TestDeadLock.lambda$main$1(TestDeadLock.java:36)
- waiting to lock <0x0000000787e868e0> (a java.lang.Object)
- locked <0x0000000787e868f0> (a java.lang.Object)
at com.flydean.TestDeadLock$$Lambda$15/0x0000000800b69c40.run(Unknown Source)
at java.lang.Thread.run(java.base@14.0.1/Thread.java:832) Found 1 deadlock.

上面的日志我们可以很明显的看出来,两个线程分别获得了对方需要的锁,所以导致了死锁。

同时还详细的列出了thread stack的信息,供我们分析。

如果我们添加了参数-XX:+PrintConcurrentLocks,还会输出各个线程的获得的concurrent lock信息。

Heap信息

最后一部分是Heap的统计信息:

Heap
garbage-first heap total 133120K, used 3888K [0x0000000780000000, 0x0000000800000000)
region size 1024K, 4 young (4096K), 0 survivors (0K)
Metaspace used 1122K, capacity 4569K, committed 4864K, reserved 1056768K
class space used 108K, capacity 412K, committed 512K, reserved 1048576K

如果我们添加了-XX:+PrintClassHistogram命令,还可以额外的输出class直方图统计信息。

总结

上面就是使用Control+Break命令来分析java死锁问题的具体例子,希望大家能够喜欢。

本文作者:flydean程序那些事

本文链接:http://www.flydean.com/jvm-diagnostic-control-break/

本文来源:flydean的博客

欢迎关注我的公众号:程序那些事,更多精彩等着您!

troubleshoot之:用control+break解决线程死锁问题的更多相关文章

  1. Python多线程,线程死锁及解决,生产者与消费者问题

    1.Thread类 普通调用 t = Thread(target=test, args=(i,)) # test为目标函数名, 若函数需要参数将其以元组形 # 式赋给args, 若无参数可不写 t.s ...

  2. 尝试解决在构造函数中同步调用Dns.GetHostAddressesAsync()引起的线程死锁

    (最终采用的是方法4) 问题详情见:.NET Core中遇到奇怪的线程死锁问题:内存与线程数不停地增长 看看在 Linux 与 Windows 上发生线程死锁的后果. Linux: Microsoft ...

  3. 线程间操作无效: 从不是创建控件“”的线程访问它~~~的解决方法~ 线程间操作无效: 从不是创建控件“Control Name'”的线程访问它问题的解决方案及原理分析

    看两个例子,一个是在一个进程里设置另外一个进程中控件的属性.另外一个是在一个进程里获取另外一个进程中控件的属性. 第一个例子 最近,在做一个使用线程控制下载文件的小程序(使用进度条控件显示下载进度)时 ...

  4. java——多线程的实现方式、三种办法解决线程赛跑、多线程数据同步(synchronized)、死锁

    多线程的实现方式:demo1.demo2 demo1:继承Thread类,重写run()方法 package thread_test; public class ThreadDemo1 extends ...

  5. CSerialPort串口类最新修正版(解决关闭死锁问题)2014-01-11

    这是一份优秀的类文件,好多的地方值得我们学习,具体在多线程,事件,自定义消息,类的封装方面等等.Remon提供的串口类网址为:http://codeguru.earthweb.com/network/ ...

  6. JDK中ThreadDump诊断Java代码中的线程死锁问题

    多线程的死锁..死锁不是死了而是线程互相等待... 在项目中可能就是在几十万行的代码中存在一个死锁的问题,如何发现这个问题并且解决这个问题. JavaJDK为我们提供了一个诊断工具叫做ThreadDu ...

  7. .NET Core中遇到奇怪的线程死锁问题:内存与线程数不停地增长

    一个 asp.net core 站点,之前运行在Linux 服务器上,运行一段时间后有时站点会挂掉,在日志中记录很多“EMFILE too many open files”的错误: Microsoft ...

  8. java笔记--关于线程死锁

    关于线程死锁 什么是死锁: 在编写多线程的时候,必须要注意资源的使用问题,如果两个或多个线程分别拥有不同的资源, 而同时又需要对方释放资源才能继续运行时,就会发生死锁. 简单来说:死锁就是当一个或多个 ...

  9. Lock锁方式解决线程安全问题

    在JDK5.0之后新增加了一种更强大的线程同步机制---通过显示定义同步锁来实现线程同步解决线程安全问题.同步锁使用Lock对象充当. java.util.concurrent.locks.lock接 ...

随机推荐

  1. CSS实现宽度自适应100%,宽高16:9的比例的矩形

    现在我们来讲讲做自适应16:9的矩形要怎么做 第一步先计算高度,假设宽100%,那么高为h=9/16=56.25% 第二步利用之前所说设置padding-bottom方法实现矩形 代码 HTML &l ...

  2. day9 python之文件操作

    1.文件操作 1.1 基本模式 # 格式 f = open("相对路径/绝对路径",mode = "模式",encoding = "编码级" ...

  3. [Qt2D绘图]-01Qt2D绘图基本绘制和填充

    Qt的文档位置为 Paint System   大纲:     简介     先看一个小例子     基本的绘制和填充         使用画笔(Qpen)         使用画刷(QBrush) ...

  4. 集训作业 洛谷P1101 单词方阵

    这个题的长度真的有点长,我直接放图片吧 这个题又是一个和谐的搜索,找到yizhong的y就开始8面搜索,遇见正确的字母就继续搜索,不正确就果断放弃,果然又是一个和谐的搜索呢. #include< ...

  5. postman之测试集

    简单点,说话的方式简单点 步骤1:测试全部通过,哈哈~ 开玩笑! 适用场景:多组数据测试,像排比句那样,有规律,比如姓名,性别,年龄.这时候的测试要求就是这些信息与返回体的结果做比较!! 步骤1:创建 ...

  6. 10种常见OOM分析——手把手教你写bug

    点赞+收藏 就学会系列,文章收录在 GitHub JavaKeeper ,N线互联网开发必备技能兵器谱,笔记自取 在<Java虚拟机规范>的规定里,除了程序计数器外,虚拟机内存的其他几个运 ...

  7. 【日常摘要】- RabbitMq实现延时队列

    简介 什么是延时队列? 一种带有延迟功能的消息队列 过程: 使用场景 比如存在某个业务场景 发起一个订单,但是处于未支付的状态?如何及时的关闭订单并退还库存? 如何定期检查处于退款订单是否已经成功退款 ...

  8. 惠普EX920强打760P驱动后无法开机,无法启动系统。

    Windows10 1909与Intel 760P驱动版本不匹配的原因,造成了强打驱动后,无法启动系统的原因. 惠普EX920强打Intel 760P驱动教程:http://tieba.baidu.c ...

  9. ~~网络编程(八):UDP~~

    进击のpython ***** 网络编程--UDP 那现在看到这里的 这就是网络编程的最后一讲了 上面讲的都是关于TCP的编程方法 还记得TCP和UDP传输的区别吗? UDP简单就简单到它可以不借助管 ...

  10. WEB简单的登录注册功能(分层)

    登录: 前端页面: <body> <form action="/webtext/LogingServlet" method="post"> ...