一次CTS引发的网络故障
接到业务部门通知,A机房(库a)到B机房(库b)之间的数据库服务器之间的网络带宽异常突增,影响公司对外业务的整体带宽。
一接到通知,作为数据库管理对所涉及的IP还是比较敏感。第一反应就是可能当时主库产生的归档特别多,把归档通过RFS进程到机房B的备库所消耗的带宽。表面上觉得很正常,这是oracle DG所需嘛! 深入分析才找到了产生大量归档的根本原因:
一、先统计下异常时间短内到底产生了多少归档日志:
HOUR_END_TIME SIZE_MB
-------------------
----------
2014-03-12 17:00:00 1073.14
2014-03-12 18:00:00 21358.794
2014-03-12 19:00:00 297.538
2014-03-12 20:00:00 221.761
2014-03-12 21:00:00 312.922
2014-03-12 22:00:00 233.074
2014-03-12 23:00:00 442.76
2014-03-13 00:00:00 194.012
如红色所示,17-18点之间突然产生了21GB归档。
二、通过logmnr对17-18点之间密集产生的归档进行分析,得出如下:
select table_name,count(*) from v$logmnr_contents group by table_name order by 2 desc;
TABLE_NAME COUNT(*)
-------------------------------- ----------
41960
table1 9459
table2 9436
table3 4816
table4 2422
table5 2380
涉及数据安全,业务表用table1,table2...table5等代替。由于这些业务表在其它服务器上都有等量数据更新,理所当然就排除了table1,table2....等。接下来对table_name为空,而count(*)极高的操作。分析发现有大量如下信息存在:
SESSION# SERIAL# USERNAME SESSION_INFO SQL_REDO SQL_UNDO
---------- ---------- ------------------------------ ------------------------------------------------ ----------------------------------------------------------
------------------------------------------------
284 30932 MATCH login_username= **** client_info= OS_username=LXZ commit;
284 30932 MATCH login_username=**** client_info= OS_username=LXZ set transaction read write;
获取sql_id
select sql_id from dba_hist_active_sess_history where session_id=284 and session_serial#=30932 ;
733mzzjjugasv
f63mmpsgtw1h5
获取sql_txt
select sql_txt from v$sql where sql_id in (' ', ' ');
或
select * from WRH$_SQLTEXT where sql_id='733mzzjjugasv' ;
找出的sql语句如下:
create table t1 as select a.*, b.* from a, b where a.supcatid = b.buy_supcatid <-----------------CTS
由于数据量大到7000万+,所以产生归档量特别多。
其实初始化时可以加上nologging属性
create table t1 nologging as select a.*, b.* from a, b where a.supcatid = b.buy_supcatid;
alter table t1 logging;
该sql在awr报告中也有体现。
一次CTS引发的网络故障的更多相关文章
- SYN flooding引发的网络故障
故障现象: 1.应用无法通过外网访问,应用服务器所在的内网网段之间(web和db数据库之间访问丢包严重)不能互相访问 其他网段正常 2.怀疑是网络设备问题,将连接该网段设备的交换机重启后故障依旧,通过 ...
- IEEP部署企业级网络工程-网络故障-环路故障
网络故障 1.环路故障 概念 1).以太网是一个支持广播的网络, 在没有环路的环境中,广播报文在网络中以泛洪的形式被送达到网络的第一个角落,以保证每个设备都能够接受到它.每台二层设备在接收到广播报文以 ...
- 一次VLAN标签引发的网络事件的处置
一次VLAN标签引发的网络事件的处置 一.背景介绍 事件背景: HZ某分公司新装一套业务系统,通过一条专线和BJ总公司连通.分配给HZ公司的ip地址为:a.b.c.X,掩码24位,网关a.b.c.1. ...
- H3C交换机引发的奇葩故障
设备:H3C S5120-28P-SI 故障:某个交换机的接口速率只有100Mbps. 描述:这个故障还是很特别的,因为按普通的测试办法很难第一时间判断是交换机的固件问题,我也是做了几乎所有外围设备和 ...
- 记一次诡异的网络故障排除 - tpc_tw_recycle参数引起的网络故障
一.故障现象 我们团队访问腾讯云上部署的测试环境中的Web系统A时,偶尔会出现类似于网络闪断的情况,浏览器卡很久没有反应,最终报Connection Timeout. 不过奇怪的是,当团队中的某个人无 ...
- React Native 在用户网络故障时自动调取缓存
App往往都有缓存功能,例如常见的新闻类应用,如果你关闭网络,你上次打开App加载的数据还在,只是不能加载新的数据了. 我的博客bougieblog.cn,欢迎前来尬聊. 集中处理请求 如果你fetc ...
- ZK 网络故障应对法
网络故障可以说是分布式系统天生的宿敌.如果永远不发生网络故障,我们实际上可以设计出高可用强一致的分布式系统.可惜的是不发生网络故障的分布式环境还不存在,ZK 使用过程中也需要小心的应付网络故障. 让我 ...
- traceroute排查网络故障 www.qq.com排查网络故障网络不通 先ping自己
网络不通 先ping自己 在ping网关 再ping外网 再ping别人的ip 背景需求 Linux 因为其强大的网络处理能力,被广泛用于网关(实例链接)和服务器(实例链接).实际工作中,快速排查这些 ...
- 一次“不负责任”的 K8s 网络故障排查经验分享
作者 | 骆冰利 来源 | Erda 公众号 某天晚上,客户碰到了这样的问题:K8s 集群一直扩容失败,所有节点都无法正常加入集群.在经过多番折腾无解后,客户将问题反馈到我们这里,希望得到技术支持 ...
随机推荐
- Spring---基础配置
1.@Scope 1.1.描述了Spring容器如何新建Bean的实例: 1.2.@Scope(value="") value值有: 1.2.1.singleton 一个Sprin ...
- Java 9 在win10环境搭建
Java SDK 下载地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk9-downloads-3848520.html JA ...
- mobx学习笔记01——什么是mobx?
mobx是什么? js框架 官方定义:Simple,scalable state management(简单.可扩展的状态管理) mobx与redux相比: 语义丰富.响应式编程,开发难度低.学习成本 ...
- Centos7.4 离线安装httpd(解决rpm依赖)
1.直接下载httpd的rpm安装包,安装失败需要先解决依赖. [root@node06 ~]# rpm -ivh httpd--.el7.centos.x86_64.rpm warning: htt ...
- spring-boot整合Mybatis案例
1.运行环境 开发工具:intellij idea JDK版本:1.8 项目管理工具:Maven 3.2.5 2.Maven Plugin管理 <?xml version="1.0&q ...
- paper 150:GCC--GNU Compiler Collection(GNU编译器套件)
gcc命令 编程开发 gcc命令使用GNU推出的基于C/C++的编译器,是开放源代码领域应用最广泛的编译器,具有功能强大,编译代码支持性能优化等特点.现在很多程序员都应用GCC, ...
- puppet(一种Linux、Unix、windows平台的集中配置管理系统)
puppet是一种Linux.Unix.windows平台的集中配置管理系统,使用自有的puppet描述语言,可管理配置文件.用户.cron任务.软件包.系统服务等.puppet把这些系统实体称之为资 ...
- AGC013 E Placing Squares——模型转化+矩阵乘法
题目:https://atcoder.jp/contests/agc013/tasks/agc013_e 边长的平方,可以看做是在该范围内放两个不同的球的方案数.两个球可以重合. 题意变成:给长为 n ...
- moment.js 时间库
一.概念: https://www.cnblogs.com/Jimc/p/10591580.html 或 http://momentjs.cn/(官网) 1.Moment.js是一个 ...
- <HTTP权威指南>记录 ---- 网络爬虫
网络爬虫 网络爬虫(web crawler)能够在无需人类干预的情况下自动进行一系列Web事务处理的软件程序.很多爬虫会从一个Web站点逛到另一个Web站点,获取内容,跟踪超链,并对它们找到的数据进行 ...