1、问题示例

  [Hadoop@master Logs]$ jps
  3728 ResourceManager
  6976 RunJar
  7587 Jps
  4277 Master
  3095 NameNode
  3863 NodeManager
  3450 SecondaryNameNode
  4362 Worker
  3245 DataNode
  [Hadoop@master Logs]$ kill -9 6976
  [Hadoop@master Logs]$ jps
  3728 ResourceManager
  6976 RunJar
  4277 Master
  3095 NameNode
  3863 NodeManager
  7607 Jps
  3450 SecondaryNameNode
  4362 Worker
  3245 DataNode

  问题描述:不正常启动Hive,留下的RunJar进程,通过不能成功kill掉,该进程变成僵尸进程。

2、问题剖析

  参考:https://blog.csdn.net/walykyy/article/details/113253060

  僵尸进程不能直接被kill掉,可从僵尸进程的父进程进行kill掉。

3、解决方案

  找到僵尸进程,僵尸进程的父进程的标记符为:PPid.

  按如下步骤进行:

  [Hadoop@master Logs]$ cd /proc/6976
  [Hadoop@master 6976]$ ls
  ls: 无法读取符号链接cwd: 权限不够
  ls: 无法读取符号链接root: 权限不够
  ls: 无法读取符号链接exe: 权限不够
  attr coredump_filter gid_map mountinfo oom_score sched statm
  autogroup cpuset io mounts oom_score_adj schedstat status
  auxv cwd limits mountstats pagemap sessionid syscall
  cgroup environ loginuid net patch_state setgroups task
  clear_refs exe map_files ns personality smaps timers
  cmdline fd maps numa_maps projid_map stack uid_map
  comm fdinfo mem oom_adj root stat wchan
  [Hadoo@master 6976]$ cat status

  Name: java
  State: Z (zombie)
  Tgid: 6976
  Ngid: 0
  Pid: 6976
  PPid: 6975               
  TracerPid: 0
  Uid: 1001 1001 1001 1001
  Gid: 1001 1001 1001 1001
  FDSize: 0
  Groups: 0 1001
  Threads: 1
  SigQ: 3/15023
  SigPnd: 0000000000000000
  ShdPnd: 0000000000004100
  SigBlk: 0000000000000000
  SigIgn: 0000000000000000
  SigCgt: 2000000181005ccf
  CapInh: 0000000000000000
  CapPrm: 0000000000000000
  CapEff: 0000000000000000
  CapBnd: 0000001fffffffff
  CapAmb: 0000000000000000
  NoNewPrivs: 0
  Seccomp: 0
  Speculation_Store_Bypass: thread vulnerable
  Cpus_allowed: 3
  Cpus_allowed_list: 0-1
  Mems_allowed:  

  *********(此处有省略)

  Mems_allowed_list: 0
  voluntary_ctxt_switches: 50
  nonvoluntary_ctxt_switches: 14
  [Hadoop@master 6976]$ kill -9 6975
  [Hadoop@master 6976]$ jps
  3728 ResourceManager
  4277 Master
  3095 NameNode
  3863 NodeManager
  7832 Jps
  3450 SecondaryNameNode
  4362 Worker
  3245 DataNode

  以上成功kill掉僵尸进程RunJar 6975

Hive启动留下的RunJar进程不能使用Kill -9 杀不掉怎么办?的更多相关文章

  1. Linux CPU 100%, kill -9 杀不掉进程

    1: top 查看 >top -c 此时 我们使用kill -9 15003, 杀掉这个进程短暂的CPU降低几秒, 然后死灰复燃了, 又一个进程占了CPU 99% 2: 查看15003 进程状态 ...

  2. 谦先生的bug日志之hive启动权限问题

    上海尚学堂谦先生的bug日志之hive启动权限问题 这几天开始做新老集群的迁移,今天开始对hive的所有数据进行迁移,主要是表的元信息和表数据.表的元信息我们存在mysql中,跟hive的服务器并不在 ...

  3. Hive启动报错:java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

    报错详细: Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preco ...

  4. 由于启动用户实例的进程时出错,导致无法生成 SQL Server 的用户实例。该连接将关闭。

    错误:由于启动用户实例的进程时出错,导致无法生成SQL Server的用户实例. 原因:添加安装SQLEXPRESS时,估计装在了不同的目录下: 解决方法:关闭Sqlserver及相关的程序,删除目录 ...

  5. 无法启动MYSQL服务”1067 进程意外终止”解决办法

    原文:http://www.111cn.net/database/mysql/48888.htm   本文章主要是总结了各种导致mysql提示无法启动MYSQL服务"1067 进程意外终止& ...

  6. 无法启动mysql服务”1067 进程意外终止”解决办法【简记】

    本文章主要是总结了各种导致mysql提示无法启动MYSQL服务”1067 进程意外终止”的一些解决办法,有碰到mysql无法启动的同学可尝试参考. 在win7的服务器里开启MySql服务提示“wind ...

  7. 无法启动MYSQL服务”1067 进程意外终止”解决的方法

    自己一開始依照百度经验里的方法——<MySQL下载安装.配置与使用(win7x64)>去安装和配置,可是到后面步骤总是出现1067代号的错误. 慢慢折腾去解决. 这里汇总各种导致mysql ...

  8. 全网最详细的HBase启动以后,HMaster进程启动了,几秒钟以后自动关闭问题的解决办法(图文详解)

    不多说,直接上干货! 问题详情 情况描述如题所示,hbase启动以后,HMaster进程启动了,几秒钟以后自动关闭,但是HRegionServer进程正常运行: 解决办法: 1.检查下每台机器的时间是 ...

  9. 无法启动MYSQL服务”1067 进程意外终止”解决的方法——汇总及终极方法

    自己一開始依照百度经验里的方法--<MySQL下载安装.配置与使用(win7x64)>去安装和配置,可是到后面步骤总是出现1067代号的错误. 慢慢折腾去解决. 这里汇总各种导致mysql ...

  10. hive启动报错(整合spark)

    spark整合hive后,hive启动报错: ls: cannot access /export/servers/spark/lib/spark-assembly-*.jar: No such fil ...

随机推荐

  1. win10事件查看器出现10016错误的解决办法

    该错误一般会重复出现在事件查看器,严重的会导致系统卡死. 以解决下列错误为例,给出步骤: 注意记录用户(划掉的部分)及要添加的权限(本例为"本地激活"权限) 1.运行regedit ...

  2. WebAPI :Get、Post、Delete、Put

    public class RestClientMethod { /// <summary> /// 请求服务器地址 /// </summary> public string B ...

  3. 整合jUnit4和jUnit5

    整合jUnit4 1.引入依赖 <dependency> <groupId>org.springframework</groupId> <artifactId ...

  4. Pycharm实现sqlite数据库可视化

  5. DNS服务器(简)

    服务端:192.168.182.187 客户端:192.168.182.16 windows客户端:192.168.182.17 1.安装相关服务 yum -y install bind bind-c ...

  6. cad图整理

    UF_initialize(); tag_t ObjectTag = NULL_TAG; tag_t view_tag = NULL_TAG; UF_OBJ_disp_props_t disp_pro ...

  7. Redis集群(主从复制)

    主从复制主从复制原理 Redis集群中有很多Redis服务器,这些Reids服务器分为主服务器和从服务器. 从服务器会向主服务器发送命令:SYNC命令. 主服务器接收到SYNC命令后,开始执行GBSA ...

  8. 27 python 发送短信

    腾讯云短信服务,来进行发送短信. 注册账号 开通服务 + 缴费 (实名.企业认证,公众号) API服务.SDK服务 API,接口 import requests # 在此之前还会处理签名和加密的工作量 ...

  9. 使用类的习题(c++ prime plus)

    第一题 vect.h: #ifndef VECTOR_H_ #define VECTOR_H_ #include <iostream> namespace VECTOR { class V ...

  10. 20200925--矩阵乘法(奥赛一本通P94 多维数组)

    计算两个矩阵的乘法.n*m阶的矩阵A乘以m*k阶的矩阵B得到的矩阵C是n*k阶的,且C[i][j]=A[i][0]*B[0][j]+A[i][1]*B[1][j]+...+A[i][m-1]*B[m- ...