DB磁盘满导致Zabbix Server Crash一例】的更多相关文章

故障描述 今天线上zabbix出现几次数据中断的情况,经排查为DB服务器磁盘空间不足导致的.还好我们目前我们zabbix,falcon两套监控系统并存,哈哈. 故障排查过程没什么技术含量,简单的将故障处理过程记录一下~ 1,开始收到DB磁盘空间不足的告警(falcon),DBA查看后表示剩余磁盘大,磁盘空间还有一百多G,没啥问题. 2,十几分钟刚好有业务线在查看监控数据,发现监控数据中断了,把问题报到我们这边. 3,开始着手排查:查看Zabbix Server进程都是OK存在的,端口监听也都没有…
问题描述: 阿里云RDS空间不足,进行报警.收到报警后.对数据库中不重要的数据备份后执行delete删除操作.执行成功后发现数据删掉了.但是数据库的空间并没有释放.数据占用空间反而越来越大,最后RDS数据库的磁盘空间满导致实例锁定,应用无法对RDS数据库进行读写操作,从而严重影响业务. 解决方案: 因为 MySQL delete 删除数据库数据后,空间并不是直接回收的.  需要执行 optimize table 回收空间.可以执行 truncate table  'tables_name'删除.…
欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答 在MGR测试中,人为制造磁盘满问题后,节点被oom killed 问题描述 在对MySQL 8.0.26 vs GreatSQL 8.0.25的对比测试过程中,有一个环节是人为制造磁盘满的场景,看看MGR是否还能正常响应请求. 在实测过程中,最后发现磁盘满的那个节点,持续时间足够久后,会因为内存消耗过大而最终被OS给OOM Kill. 这个问题我已报告BUG(#104979),…
很多年以前了,那时tester发现一个server crash,通过测试pager功能很多次,可以把server搞崩溃. 一般来说,能再现的bug都不难改,不过这次因为要跑很多次test,才能再现crash,所以测得也不容易. 记得当时为了再现这个bug,我还写了个pager的模拟器,来模拟对应的功能. 当时从tester的测试看,这个crash发生在连接刚开始阶段,但因为不能保证之后没有问题,所以就写了对应的模拟功能,虽然最后证明问题确实出在线程启动阶段,不过通过模拟器证明之后的代码没问题,也…
问题: 硬盘显示被写满,但是用du -sh /*查看时占用硬盘空间之和还远小于硬盘大小,即找不到硬盘分区是怎么被写满的.今天下午接到同事紧急求助,说生产线服务器硬盘满了.该删的日志都删掉了.可空间还是满的,情况危急啊.这个问题,在多年以前直接和间接的遇到过1-2次.以前太懒惰了,这次记录下来和大家分享. 相关日志如下: █ 查看硬盘分区大小 [root@www ~]# cat /etc/redhat-release CentOS release 6.4 (Final) [root@www ~]#…
Web服务器磁盘满故障深入解析 原文:http://blog.51cto.com/oldboy/612351 ########################################################## 硬盘显示被写满但是用du -sh /*查看时占用硬盘空间之和还远#小于硬盘大小问的解决#date:2010-06-09#作者:老男孩---<老男孩linux就业培训中心 >#QQ:31333741 MAIL:oldboy521@hotmail.com#QQ交流群:450…
阿里云ECS(linux)磁盘满触发的mysql的表异常修复案例 阿里云技术支持:完颜镇江 问题现象: 磁盘空间满了,第一想到的就是删除无用的服务日志或者升级数据盘. 通常是使用du –sh去分析目录找出占用最大的. 根据经验来说基本都是日志文件占用的,那么就是停止应用清理日志,或者清理日志后重启应用即可. 但是本实例的异常是网站主页正常,但是子导航的内容为空,首先怀疑的就是磁盘满了导致mysql数据库的数据异常. 问题排查: 排查的方法是打开mysql的errlog 添加以下配置重启mysql…
abbix监控中有时会根据需要对zabbix服务器进行迁移,zabbix迁移是非常简单的,因为zabbix的前端所有的操作都存在zabbix数据库里.所以zabbix迁移只需对zabbix库中相应的表进行导出导进即可. zabbix迁移可以针对是否迁移历史数据而分开进行,假如要求历史数据不丢失,那么需要对zabbix整个库迁移,若是对历史数据不要求,那么只迁移配置信息即可,毕竟历史数据占据了大量的空间. 1.导出zabbix数据库 1 [root@zhu2 ~]# mysqldump -uroo…
这是新找到了配置文件配置方法但未尝试 每个模块工作职责: Zabbix Server:负责接收agent发送的报告信息的核心组件,所有配置,统计数据及操作数据均由其组织进行: Database Storage:用户存储所有配置信息,以及存储由Zabbix Server收集到的数据: Web Interface: Zabbix的GUI接口,通常与Server运行在同一台主机上: Zabbix Proxy:常用于分布监控环境中,代理Server收集部分被监控的监控数据并统一发往Server端:(通常…
序号 Name Key 返回值 释义1 Agent ping agent.ping 1 就是ping一下2 Avaliable memory vm.memory.size[available] 563798016 可用的内存大小3 Checksum of /etc/passwd vfs.file.cksum[/etc/passwd]  3395042901 通过文件的cksum码检测完整性4 Context switches per second system.cpu.switches 1808…