问题描述:Linux VM异常重启,需要排查问题原因

排查结果:

查询Messages日志获取到的信息

虚拟机内核版本:

Jun  :: test01 kernel: Linux version 2.6.-642.1..el6.x86_64 (mockbuild@worker1.bsys.centos.org) (gcc version 4.4.  (Red Hat 4.4.-) (GCC) ) # SMP Tue May  :: UTC 

查看到虚拟机重启时间约为:2019/6/20 03:34 CST

Jun  :: test01 kernel: hv_utils: Shutdown request received - graceful shutdown initiated
Jun :: test01 init: tty (/dev/tty1) main process () killed by TERM signal
Jun :: test01 init: tty (/dev/tty2) main process () killed by TERM signal
Jun :: test01 init: tty (/dev/tty3) main process () killed by TERM signal
Jun :: test01 init: tty (/dev/tty4) main process () killed by TERM signal
Jun :: test01 init: tty (/dev/tty5) main process () killed by TERM signal
Jun :: test01 init: tty (/dev/tty6) main process () killed by TERM signal
Jun :: test01 init: serial (ttyS0) main process () killed by TERM signal
Jun :: test01 abrtd: Got signal , exiting
Jun :: test01 dnsmasq[]: exiting on receipt of SIGTERM
Jun :: test01 acpid: exiting
Jun :: test01 rpcbind: rpcbind terminating on signal. Restart with "rpcbind -w"
Jun :: test01 init: Disconnected from system bus
Jun :: test01 auditd[]: The audit daemon is exiting.
Jun :: test01 kernel: type= audit(1560972674.940:): audit_pid= old= auid= ses= subj=system_u:system_r:auditd_t:s0 res=
Jun :: test01 kernel: type= audit(1560972675.039:): audit_enabled= old= auid= ses= subj=system_u:system_r:auditctl_t:s0 res=
Jun :: test01 kernel: Kernel logging (proc) stopped.
Jun :: test01 rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="" x-info="http://www.rsyslog.com"] exiting on signal .
Jun :: test01 kernel: imklog 5.8., log source = /proc/kmsg started.
Jun :: test01 rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="" x-info="http://www.rsyslog.com"] start
Jun :: test01 kernel: Initializing cgroup subsys cpuset
Jun :: test01 kernel: Initializing cgroup subsys cpu
Jun :: test01 kernel: Linux version 2.6.-642.1..el6.x86_64 (mockbuild@worker1.bsys.centos.org) (gcc version 4.4. (Red Hat 4.4.-) (GCC) ) # SMP Tue May :: UTC
Jun :: test01 kernel: Command line: ro root=UUID=adc76f7c-fef6--941e-e7ce50fb3e50 rd_NO_LUKS KEYBOARDTYPE=pc KEYTABLE=us LANG=en_US.UTF- rd_NO_MD SYSFONT=latarcyrheb-sun16 console=ttyS0,115200n8 earlyprintk=ttyS0, rootdelay= rd_NO_LVM rd_NO_DM
Jun :: test01 kernel: KERNEL supported cpus:
Jun :: test01 kernel: Intel GenuineIntel
Jun :: test01 kernel: AMD AuthenticAMD
Jun :: test01 kernel: Centaur CentaurHauls

查询到虚拟机重启之前出现了Kernel Panic的错误,提示:INFO: task jbd2/sda1-8:540 blocked for more than 120 seconds. 备注:jdb2进程是一个文件系统的写journal的进程

Jun  :: test01 auditd[]: Audit daemon rotating log files
Jun :: test01 kernel: INFO: task jbd2/sda1-: blocked for more than seconds.
Jun :: test01 kernel: Not tainted 2.6.-642.1..el6.x86_64 #
Jun :: test01 kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jun :: test01 kernel: jbd2/sda1- D 0x00000000
Jun :: test01 kernel: ffff880433257b30 ffff880433336d80
Jun :: test01 kernel: 000000002a5c72b4 ffffffffa307745d ffff880433257ae0 ffff880433257ad0
Jun :: test01 kernel: ffffffffa0045958 ffff8804316505f8 ffff880433257fd8
Jun :: test01 kernel: Call Trace:
Jun :: test01 kernel: [<ffffffffa0045958>] ? read_hv_clock_tsc+0x38/0x80 [hv_vmbus]
Jun :: test01 kernel: [<ffffffff8112e610>] ? sync_page+0x0/0x50
Jun :: test01 kernel: [<ffffffff81547db3>] io_schedule+0x73/0xc0
Jun :: test01 kernel: [<ffffffff8112e64d>] sync_page+0x3d/0x50
Jun :: test01 kernel: [<ffffffff8154889f>] __wait_on_bit+0x5f/0x90
Jun :: test01 kernel: [<ffffffff8112e883>] wait_on_page_bit+0x73/0x80
Jun :: test01 kernel: [<ffffffff810a6b40>] ? wake_bit_function+0x0/0x50
Jun :: test01 kernel: [<ffffffff811449c5>] ? pagevec_lookup_tag+0x25/0x40
Jun :: test01 kernel: [<ffffffff8112ecab>] wait_on_page_writeback_range+0xfb/0x190
Jun :: test01 kernel: [<ffffffff8112ed6f>] filemap_fdatawait+0x2f/0x40
Jun :: test01 kernel: [<ffffffffa00bfe59>] jbd2_journal_commit_transaction+0x7e9/0x14f0 [jbd2]
Jun :: test01 kernel: [<ffffffff8108fd4b>] ? try_to_del_timer_sync+0x7b/0xe0
Jun :: test01 kernel: [<ffffffffa00c5a38>] kjournald2+0xb8/0x220 [jbd2]
Jun :: test01 kernel: [<ffffffff810a6ac0>] ? autoremove_wake_function+0x0/0x40
Jun :: test01 kernel: [<ffffffffa00c5980>] ? kjournald2+0x0/0x220 [jbd2]
Jun :: test01 kernel: [<ffffffff810a662e>] kthread+0x9e/0xc0
Jun :: test01 kernel: [<ffffffff8100c28a>] child_rip+0xa/0x20
Jun :: test01 kernel: [<ffffffff810a6590>] ? kthread+0x0/0xc0
Jun :: test01 kernel: [<ffffffff8100c280>] ? child_rip+0x0/0x20

查询了secure日志,仅仅发现有关机信号的记录,没有更加详细的信息了  备注:SIGTERM 15 A 终止信号

Jun  :: test01 sshd[]: Received signal ; terminating.
Jun :: test01 sshd[]: Server listening on 0.0.0.0 port .
Jun :: test01 sshd[]: Server listening on :: port .

查询了Linux问题虚拟机所在的物理节点,发现早在6/20 03:10 CST左右,物理节点已经出现了系统故障,虚拟机被自动迁移至其他可用节点,此过程造成了虚拟机的自动重启

总结:在某些情况下,服务器系统日志出现了call trace的报错,也不一定是操作系统层面引起的问题,还可能是物理节点(针对虚拟机)或硬件故障。

Linux由于物理节点故障导致的异常重启-Case1的更多相关文章

  1. 【原创】访问Linux进程文件表导致系统异常复位的排查记录

    前提知识: Linux内核.Linux 进程和文件数据结构.vmcore解析.汇编语言 问题背景: 这个问题出自项目的一个安全模块,主要功能是确定某进程是否有权限访问其正在访问的文件. 实现功能时,需 ...

  2. Linux 文件系统引起的云盘文件系统异常导致 MySQL 数据页损坏事故恢复复盘

    事故的起因是因为当我访问某个数据库的某个表的时候,MySQL 立即出现崩溃并且去查看 MySQL 的错误日志出现类似信息 --09T05::.232564Z [ERROR] InnoDB: Space ...

  3. Linux系统运维故障排查

    一.思路 1.处理问题要求 2.一般思路 二.具体问题 1.网络问题 (1)网络不通 (2)网络很慢 2.硬件问题 3.操作系统问题 (1)系统无法正常启动 (2)系统运行慢或死机 4.服务或程序问题 ...

  4. Linux服务器丢包故障的解决思路及引申的TCP/IP协议栈理论

    我们使用Linux作为服务器操作系统时,为了达到高并发处理能力,充分利用机器性能,经常会进行一些内核参数的调整优化,但不合理的调整常常也会引起意想不到的其他问题,本文就一次Linux服务器丢包故障的处 ...

  5. [转载]Linux服务器丢包故障的解决思路及引申的TCP/IP协议栈理论

    Linux服务器丢包故障的解决思路及引申的TCP/IP协议栈理论 转载至:https://www.sdnlab.com/17530.html 我们使用Linux作为服务器操作系统时,为了达到高并发处理 ...

  6. VS2012外接程序VMDebugger未能加载或导致了异常

    转http://blog.csdn.net/maryhuan/article/details/42676915 故障现象:打开Visual Studio 2010后弹出错误框,外接程序VMDebugg ...

  7. RAC OCR盘故障导致的集群重启恢复

    一.事故说明 最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功. 因此在此处 ...

  8. Linux 虚拟机虚拟网卡问题导致无法连接问题

    问题描述 当 Linux 虚拟机启动时,通过串口输出或者启动日志, 观察到虚拟网卡启动或者初始化故障, 导致虚拟机无法连接. 问题分析 常见的超时报错范例如下: CentOS 复制 Bringing ...

  9. Linux MySQL 常见无法启动或启动异常的解决方案

    Linux MySQL 常见无法启动或启动异常的解决方案 在 Linux 上自建 MySQL 服务器,经常遇到各种无法启动或启动后异常的问题,本文列举一些常见问题的解决办法. 注意:以下错误日志提示, ...

随机推荐

  1. [转]C++ 类中的static成员的初始化和特点

    在C++的类中有些成员变量初始化和一般数据类型的成员变量有所不同.以下测试编译环境为: ➜ g++ -v Using built-in specs. COLLECT_GCC=g++ Target: x ...

  2. linux系列(十九):firewall-cmd命令

    1.命令格式 firewall-cmd [选项] [参数] 2.命令功能: 简单来说是一个防火墙管理工具. 3.简单使用: systemctl start firewalld # 启动, system ...

  3. CSPS分数取mod赛92-93

    我好菜啊..... 92只会打暴力,93暴力都不会了 模拟92, T1:直接ex_gcd加分类讨论即可 T2:考场只会打暴搜,正解为排序后线段树解决,排序的关键字为a+b,因为如果ai<bj&a ...

  4. [bzoj 4872][六省联考2017]分手是祝愿

    传送门 Description N个灯按照1~N标号,按下一个开关i,所有标号是i的约数的开关都改变状态,目标是关掉所有的灯,如果当前最优策略≤k就直接按照最优策略走.否则随机按下一个开关.给出每个灯 ...

  5. 小程序弹出toast,怎么优化代码

    因为toast是会重复调的,所以可以直接写在app里面 在所有的子页面去调这个就好了. 如果是设的none那就是 设置的 就是

  6. 【零基础】神经网络优化之mini-batch

    一.前言 回顾一下前面讲过的两种解决过拟合的方法: 1)L0.L1.L2:在向前传播.反向传播后面加个小尾巴 2)dropout:训练时随机“删除”一部分神经元 本篇要介绍的优化方法叫mini-bat ...

  7. git clone 报“The project you were looking for could not be found.”

    因为自己的项目不止一个 又有自动保存git密码的功能,当clone第二个项目的时候就报了如下错误 之前一直是找到钥匙串删除,发现有时候并没有效果.今天在网上搜了一下 发现了一个新的解决办法 在项目前面 ...

  8. android: View, SurfaceView, GLSurfaceView, TextureView 区别与联系

    区别与联系 View: 显示视图,内置画布,提供了图形绘制函数.触屏事件.按键事件函数等,必须在UI主线程内更新画面,速度较慢: SurfaceView: 基于view视图进行拓展的视图类,更适合2D ...

  9. 三种实现PHP伪静态页面的方法

    PHP伪静态写法--其一 伪静态又名:URL重写  主要是为了SEO而生的.(SEO是什么?这个不用问我吧.呵呵-搞网络的不懂SEO那就----) 方法一: 比如这个网页 /soft.php/1,10 ...

  10. 一百四十二:CMS系统之帖子详情页面布局

    定义一个404页面 <!DOCTYPE html><html lang="en"><head> <meta charset="U ...