好久没有写博客  现在重新捡起来  记录工作中遇到的问题  方便以后在遇到类似的问题也有一个参考. 背景:有一天生产服务器redis  cpu 频繁报警    单核cpu 所以在想是不是业务量上来了.确定之后发现不是这个问题. 排查思路: 1. 查看监控cpu 最近三天 七天的历史状态 发现cpu目前是异常状态,比往常要高很多 2. 查看慢日志 发现有get app_encrypted:crawler_task_switch 获取某个key 用了40ms 3. monitor 监控当前命令使用状…
Windows内核分析索引目录:https://www.cnblogs.com/onetrainee/p/11675224.html CPU异常的记录(trap00为例) 一.CPU检测到除零异常的执行流程 二.Trap00 函数的分析 当发生除零异常时,查IDT表会查到Trap00函数,该函数的目的是构建_KTRAP_FRAME结构,查错误码,之后调用 commonDispatchExcption进行封装. 我们可能很奇怪,明明CPU检测到的错误,本身就在内核,还会有 _KTRAP_FRAME…
Windows内核分析索引目录:https://www.cnblogs.com/onetrainee/p/11675224.html 两种异常(CPU异常.用户模拟异常)的收集  文章的核心:异常收集的是什么?(TrapFrame与ExceptionRecord):如何收集异常?(看文章). 1. 异常的分类 ① CPU指令异常 (比如除零异常) CPU运行检测到: ② 用户模拟异常 (throw 1) 其在收集是存在不同,但在派发时和处理时是完全相同的,下面我们就来分析一下其存在的不同. 2.…
CPU异常主要分为三类:错误类异常,陷阱类异常和终止类异常 1 错误类异常 Fault CPU遇到该类异常后,会先将CS和EIP(当前发生错误的指令,而不是下一条指令)压栈,然后跳到异常处理函数中,执行完成后恢复到原位置重新执行该指令,如果还有错误,还会再进. 例如内存缺页异常就是错误类异常,CPU遇到缺页异常时会跳转到异常处理,将缺少的内存页从物理内存中置换回来,再恢复重新执行内存访问指令. 2 陷阱类异常 Trap CPU遇到该类异常后,会将CS和EIP压栈,这个EIP就是当前指令的下一条指…
1.CPU使用率为单位时间内CPU使用情况的统计,以百分比的方式展示. LINUX作为一个多任务操作系统,将每个CPU的时间划分为很短的时间片,再通过调度器轮流分配给各个任务使用,因此造成多任务同时运行的错觉 2.如何查看CPU使用率? TOP和PS是最常用的性能分析工具.TOP显示了系统总体的CPU和内存使用情况,以及各个进程的资源使用情况 PS则只显示了每个进程的资源使用情况 pidstat是专门分析每个进程的CPU使用情况的工具 TOP输出: # 默认每 3 秒刷新一次$ toptop -…
Redis发生异常WRONGTYPE Operation against a key holding the wrong kind of value Redis发生异常WRONGTYPE Operation against a key holding the wrong kind of value发生这个异常的原因大概就是你的当前程序中key的操作类型,并不与redis库中存在的key的类型相匹配.举个荔枝:1.你 SADD bbs “discuz.net” 向一个key为bbs的集合中添加了…
目录 一.问题详情 top 命令截图 联系腾讯云排查 检查系统日志发现异常 二. 问题解析 三.问题原因 最终结论 四.扩展 进程的几种状态 马后炮 如何快速清理僵尸进程(Z) 内核参数相关 如何查看哪些文件被哪些进程被锁 一.问题详情 linux一切皆文件 2021年4月2号,晚上10.45分左右,线上业务异常,后排查 线上服务器CPU 异常高,机器是 16核 64G的.但是实际负载已经达到了 140左右. top 命令截图 联系腾讯云排查 虚拟机所属于物理机是否有故障. 虚拟机所用的资源是否…
Db2性能:系统CPU高问题分析的一些思路 1. 如何判断CPU高? 有很多操作系统的命令可以看出来,比如ps -elf,iostat, vmstat, top/topas, 2. 收集数据 CPU高分为usr高和sys高,前者表示系统在执行应用代码,一般需要应用(比如Db2)来查原因.后者表示系统在执行kernal code,一般需要OS工程师协助分析. A. sys CPU高 如果是%sys CPU高,这意味着系统在执行kernel code,这种情况下需要操作系统工程师一块支持,来从操作系…
早上到公司,发现邮箱内有报警信息显示CPU和IO使用都已超标.报警内容如下:主机: test-server-192.168.1.18 时间: 2015.11.15 15:25:17状态: PROBLEM 级别:Warning报警原因: Processor load is too high on test-server内容: Processor load (1 min average per core):value=52.53原始事件ID: 30605 主机: test-server-192.16…
13:05 2015/9/11 午睡醒来收到几封CPU使用率预警邮件.登录对应服务器,打开资源监视器,看到sqlservr.exe进程的CPU达到40%(平常服务器CPU消耗在10%以内).查看CPU信息跟踪表,近一小时的CPU都维持在40%左右.图1 CPU使用率预警邮件图2 资源监视器和CPU信息跟踪表开启profiler跟踪,筛选CPU>60毫秒的事件.发现有一个存储过程调用非常频繁,而且cpu>90 read>2800.查看此过程,语句很简单,返回记录数很少,表上有对应索引.但从…