接到业务部门通知,A机房(库a)到B机房(库b)之间的数据库服务器之间的网络带宽异常突增,影响公司对外业务的整体带宽。
一接到通知,作为数据库管理对所涉及的IP还是比较敏感。第一反应就是可能当时主库产生的归档特别多,把归档通过RFS进程到机房B的备库所消耗的带宽。表面上觉得很正常,这是oracle DG所需嘛! 深入分析才找到了产生大量归档的根本原因:
  一、先统计下异常时间短内到底产生了多少归档日志:
HOUR_END_TIME        SIZE_MB 
------------------- 
---------- 
2014-03-12 17:00:00     1073.14 
2014-03-12 18:00:00   21358.794 
2014-03-12 19:00:00     297.538 
2014-03-12 20:00:00     221.761 
2014-03-12 21:00:00     312.922 
2014-03-12 22:00:00     233.074 
2014-03-12 23:00:00 442.76 
2014-03-13 00:00:00     194.012 
如红色所示,17-18点之间突然产生了21GB归档。
二、通过logmnr对17-18点之间密集产生的归档进行分析,得出如下:
select table_name,count(*) from v$logmnr_contents group by table_name order by 2 desc;
TABLE_NAME                               COUNT(*)
--------------------------------               ----------
                                                         41960
table1                                             9459
table2                                             9436
table3                                             4816
table4                                              2422
table5                                             2380

涉及数据安全,业务表用table1,table2...table5等代替。由于这些业务表在其它服务器上都有等量数据更新,理所当然就排除了table1,table2....等。接下来对table_name为空,而count(*)极高的操作。分析发现有大量如下信息存在:

SESSION#    SERIAL# USERNAME                       SESSION_INFO                       SQL_REDO       SQL_UNDO                                         
 ---------- ---------- ------------------------------ ------------------------------------------------      ----------------------------------------------------------                        
 ------------------------------------------------

284      30932 MATCH                          login_username= ****  client_info= OS_username=LXZ      commit;

                                                                              
        284      30932 MATCH                          login_username=****  client_info= OS_username=LXZ        set transaction read write;

获取sql_id

select sql_id from dba_hist_active_sess_history where session_id=284 and session_serial#=30932 ;

733mzzjjugasv

f63mmpsgtw1h5

获取sql_txt

select sql_txt from v$sql where sql_id in ('     ',    '       ');

select * from WRH$_SQLTEXT where sql_id='733mzzjjugasv' ;

找出的sql语句如下:

create table t1 as select a.*, b.* from   a,   b where a.supcatid = b.buy_supcatid  <-----------------CTS

由于数据量大到7000万+,所以产生归档量特别多。

其实初始化时可以加上nologging属性

create table t1  nologging as select a.*, b.* from   a,   b where a.supcatid = b.buy_supcatid;

alter table t1 logging;

该sql在awr报告中也有体现。

一次CTS引发的网络故障的更多相关文章

  1. SYN flooding引发的网络故障

    故障现象: 1.应用无法通过外网访问,应用服务器所在的内网网段之间(web和db数据库之间访问丢包严重)不能互相访问 其他网段正常 2.怀疑是网络设备问题,将连接该网段设备的交换机重启后故障依旧,通过 ...

  2. IEEP部署企业级网络工程-网络故障-环路故障

    网络故障 1.环路故障 概念 1).以太网是一个支持广播的网络, 在没有环路的环境中,广播报文在网络中以泛洪的形式被送达到网络的第一个角落,以保证每个设备都能够接受到它.每台二层设备在接收到广播报文以 ...

  3. 一次VLAN标签引发的网络事件的处置

    一次VLAN标签引发的网络事件的处置 一.背景介绍 事件背景: HZ某分公司新装一套业务系统,通过一条专线和BJ总公司连通.分配给HZ公司的ip地址为:a.b.c.X,掩码24位,网关a.b.c.1. ...

  4. H3C交换机引发的奇葩故障

    设备:H3C S5120-28P-SI 故障:某个交换机的接口速率只有100Mbps. 描述:这个故障还是很特别的,因为按普通的测试办法很难第一时间判断是交换机的固件问题,我也是做了几乎所有外围设备和 ...

  5. 记一次诡异的网络故障排除 - tpc_tw_recycle参数引起的网络故障

    一.故障现象 我们团队访问腾讯云上部署的测试环境中的Web系统A时,偶尔会出现类似于网络闪断的情况,浏览器卡很久没有反应,最终报Connection Timeout. 不过奇怪的是,当团队中的某个人无 ...

  6. React Native 在用户网络故障时自动调取缓存

    App往往都有缓存功能,例如常见的新闻类应用,如果你关闭网络,你上次打开App加载的数据还在,只是不能加载新的数据了. 我的博客bougieblog.cn,欢迎前来尬聊. 集中处理请求 如果你fetc ...

  7. ZK 网络故障应对法

    网络故障可以说是分布式系统天生的宿敌.如果永远不发生网络故障,我们实际上可以设计出高可用强一致的分布式系统.可惜的是不发生网络故障的分布式环境还不存在,ZK 使用过程中也需要小心的应付网络故障. 让我 ...

  8. traceroute排查网络故障 www.qq.com排查网络故障网络不通 先ping自己

    网络不通 先ping自己 在ping网关 再ping外网 再ping别人的ip 背景需求 Linux 因为其强大的网络处理能力,被广泛用于网关(实例链接)和服务器(实例链接).实际工作中,快速排查这些 ...

  9. 一次“不负责任”的 K8s 网络故障排查经验分享

    作者 | 骆冰利 来源 | Erda 公众号 ​ 某天晚上,客户碰到了这样的问题:K8s 集群一直扩容失败,所有节点都无法正常加入集群.在经过多番折腾无解后,客户将问题反馈到我们这里,希望得到技术支持 ...

随机推荐

  1. Spring---基础配置

    1.@Scope 1.1.描述了Spring容器如何新建Bean的实例: 1.2.@Scope(value="") value值有: 1.2.1.singleton 一个Sprin ...

  2. Java 9 在win10环境搭建

    Java SDK 下载地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk9-downloads-3848520.html JA ...

  3. mobx学习笔记01——什么是mobx?

    mobx是什么? js框架 官方定义:Simple,scalable state management(简单.可扩展的状态管理) mobx与redux相比: 语义丰富.响应式编程,开发难度低.学习成本 ...

  4. Centos7.4 离线安装httpd(解决rpm依赖)

    1.直接下载httpd的rpm安装包,安装失败需要先解决依赖. [root@node06 ~]# rpm -ivh httpd--.el7.centos.x86_64.rpm warning: htt ...

  5. spring-boot整合Mybatis案例

    1.运行环境 开发工具:intellij idea JDK版本:1.8 项目管理工具:Maven 3.2.5 2.Maven Plugin管理 <?xml version="1.0&q ...

  6. paper 150:GCC--GNU Compiler Collection(GNU编译器套件)

    gcc命令 编程开发            gcc命令使用GNU推出的基于C/C++的编译器,是开放源代码领域应用最广泛的编译器,具有功能强大,编译代码支持性能优化等特点.现在很多程序员都应用GCC, ...

  7. puppet(一种Linux、Unix、windows平台的集中配置管理系统)

    puppet是一种Linux.Unix.windows平台的集中配置管理系统,使用自有的puppet描述语言,可管理配置文件.用户.cron任务.软件包.系统服务等.puppet把这些系统实体称之为资 ...

  8. AGC013 E Placing Squares——模型转化+矩阵乘法

    题目:https://atcoder.jp/contests/agc013/tasks/agc013_e 边长的平方,可以看做是在该范围内放两个不同的球的方案数.两个球可以重合. 题意变成:给长为 n ...

  9. moment.js 时间库

    一.概念:    https://www.cnblogs.com/Jimc/p/10591580.html    或    http://momentjs.cn/(官网) 1.Moment.js是一个 ...

  10. <HTTP权威指南>记录 ---- 网络爬虫

    网络爬虫 网络爬虫(web crawler)能够在无需人类干预的情况下自动进行一系列Web事务处理的软件程序.很多爬虫会从一个Web站点逛到另一个Web站点,获取内容,跟踪超链,并对它们找到的数据进行 ...