1 对这一个小时进行AWR的收集和分析,首先,从报告头中看到DB Time达到近500分钟,(DB Time)/Elapsed=8,这个比值偏高:

 

Snap Id

Snap Time

Sessions

Cursors/Session

Begin Snap:

15142

20-11月-12 09:00:05

62

5.8

End Snap:

15143

20-11月-12 10:00:56

74

8.3

Elapsed:

 

60.85 (mins)

   

DB Time:

 

492.88 (mins)

   

2 再看TOP 5事件:

看到排在第一位的是enq: TX - row lock contention事件,也就是说系统中在这一个小时里产生了较为严重的行级锁等待事件。

Top 5 Timed Events

Event

Waits

Time(s)

Avg Wait(ms)

% Total Call Time

Wait Class

CPU time

 

21,215

 

71.7

 

enq: TX - row lock contention

12,232

6,013

492

20.3

Application

gc cr multi block request

14,696,067

1,675

0

5.7

Cluster

gc buffer busy

441,472

719

2

2.4

Cluster

db file sequential read

4,191

25

6

.1

User I/O

通常,产生enq: TX - row lock contention事件的原因有以下几种可能:

· 不同的session更新或删除同一条记录;

· 唯一索引有重复索引;

· 位图索引同时被更新或同时并发的向位图索引字段上插入相同字段值;

· 并发的对同一个数据块上的数据进行update操作;

· 等待索引块完成分裂;

同时,从段的统计信息章节中,也看到下面的信息:

Segments by Row Lock Waits

· % of Capture shows % of row lock waits for each top segment compared

· with total row lock waits for all segments captured by the Snapshot

Owner

Tablespace Name

Object Name

Subobject Name

Obj. Type

Row Lock Waits

% of Capture

SUNISCO

SUNISCO_DATA1

BIND_PROCESS_LOG_REFNO

 

INDEX

159

67.66

SUNISCO

FDN_EDI_I01

IDX_EDI_WORK_QUEUE_1

 

INDEX

29

12.34

SUNISCO

SUNISCO_DATA1

IND_EDI_CUSTOMER_TYPE_CODE

 

INDEX

15

6.38

SUNISCO

SUNISCO_DATA1

IDX_EDI_MESSAGE_1

 

INDEX

14

5.96

SUNISCO

FDN_BASE_T01

BSE_NUM_LIST

 

TABLE

6

2.55

看到row lock waits发生在索引上。

3那么,究竟是什么操作导致了这个enq: TX - row lock contention等待事件呢? 查看系统中,当前有哪些会话产生了enq: TX - row lock contention等待事件?

1

2

3

4

5

6

7

8

9

10

SQL>selectevent,sid,p1,p2,p3 fromv$session_wait whereevent='enq: TX - row lock contention';

EVENT                                                                   SID         P1         P2         P3

---------------------------------------------------------------- ---------- ---------- ---------- ----------

enq: TX - row lock contention                                           224 1415053316    1441815     144197

enq: TX - row lock contention                                           238 1415053316    1441815     144197

enq: TX - row lock contention                                           247 1415053316    1441815     144197

enq: TX - row lock contention                                           248 1415053316    1441815     144197

enq: TX - row lock contention                                           253 1415053316    1441815     144197

SQL>

看到SID为224,238,247,248,253的会话产生enq: TX - row lock contention等待事件。

4 查看系统中的当前会话,是在哪个对象上产生了产生了enq: TX - row lock contention等待事件?

1

2

3

4

5

6

7

8

9

10

11

12

13

SQL>selectROW_WAIT_OBJ#,ROW_WAIT_FILE#,ROW_WAIT_BLOCK#,ROW_WAIT_ROW# fromv$session whereevent='enq: TX - row lock contention';

ROW_WAIT_OBJ# ROW_WAIT_FILE# ROW_WAIT_BLOCK# ROW_WAIT_ROW#

------------- -------------- --------------- -------------

369195              0               0             0

369195              0               0             0

369195              0               0             0

369195              0               0             0

369195              0               0             0

369195              0               0             0

6 rowsselected

SQL>

5 那么这个数据库对象为369195的对象究竟是什么呢?

1

2

3

4

5

6

7

8

9

10

11

SQL>selectobject_name,object_id fromdba_objects whereobject_id=369195;

OBJECT_NAME                          OBJECT_ID

----------------------------------- ----------

BIND_PROCESS_LOG_REFNO                  369195

SQL>selectOWNER,OBJECT_NAME,OBJECT_ID,DATA_OBJECT_ID, OBJECT_TYPE fromdba_objects whereobject_name='BIND_PROCESS_LOG_REFNO';

OWNER                          OBJECT_NAME                    OBJECT_ID DATA_OBJECT_ID OBJECT_TYPE

------------------------------ ----------------------------- ---------- -------------- -------------------

SUNISCO                        BIND_PROCESS_LOG_REFNO            369195         369195 INDEX

SQL>

可以看到,定位到的结果同上述AWR报告中段统计信息吻合,是SUNISCO这个用户下的一个索引。

6接下来,继续看看SID为224,238,247,248,253的会话到底在执行哪些操作导致enq: TX - row lock contention等待事件?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

1

SQL>selectsid,sql_text fromv$session a,v$sql b wheresid in(224,238,247,248,253) and(b.sql_id=a.sql_id orb.sql_id=a.prev_sql_id);

SID SQL_TEXT

---------- --------------------------------------------------------------------------------

224 selectcount(1)  fromEDI_MESSAGE_PROCESS_LOG where (LOG_ID =  :P_0_0  )

224 INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE, SERVICE_STATUS, INFO_C

238 selectcount(1)  fromEDI_MESSAGE_PROCESS_LOG where (LOG_ID =  :P_0_0  )

238 INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE, SERVICE_STATUS, INFO_C

247 INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE, SERVICE_STATUS, REFNO,

247 INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE, SERVICE_STATUS, REFNO,

248 INSERTINTOEDI_MESSAGE_PROCESS_LOG (LOG_ID, SERVICE_TYPE, SERVICE_STATUS, REFNO

248 INSERTINTOEDI_MESSAGE_PROCESS_LOG (LOG_ID, SERVICE_TYPE, SERVICE_STATUS, REFNO

248 SELECTSEQ_NEWID.NEXTVAL FROMDUAL

253 SELECTSEQ_NEWID.NEXTVAL FROMDUAL

253 INSERTINTOEDI_MESSAGE_PROCESS_LOG (LOG_ID, SERVICE_TYPE, SERVICE_STATUS, REFNO

11 rowsselected

SQL>

看到有SQL_ID不同的SQL在同时向EDI_MESSAGE_PROCESS_LOG这张表执行INSERT操作。

7 接下去看看EDI_MESSAGE_PROCESS_LOG这张表和索引BIND_PROCESS_LOG_REFNO之间有没有什么关系?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

SQL>selectindex_name,table_name,index_type fromuser_indexes wheretable_name='EDI_MESSAGE_PROCESS_LOG';

INDEX_NAME                     TABLE_NAME                     INDEX_TYPE

------------------------------ ------------------------------ ----------

PK_EDI_MESSAGE_PROCESS_LOG     EDI_MESSAGE_PROCESS_LOG        NORMAL

ID_EDI_LOG_INPUT_DATE          EDI_MESSAGE_PROCESS_LOG        NORMAL

BIND_PROCESS_LOG_REFNO         EDI_MESSAGE_PROCESS_LOG        BITMAP

SQL>selectindex_name,table_name,column_name fromuser_ind_columns wheretable_name='EDI_MESSAGE_PROCESS_LOG';

INDEX_NAME                     TABLE_NAME                     COLUMN_NAM

------------------------------ ------------------------------ ----------

PK_EDI_MESSAGE_PROCESS_LOG     EDI_MESSAGE_PROCESS_LOG        LOG_ID

ID_EDI_LOG_INPUT_DATE          EDI_MESSAGE_PROCESS_LOG        INPUT_DATE

BIND_PROCESS_LOG_REFNO         EDI_MESSAGE_PROCESS_LOG        REFNO

SQL>selectobject_name,object_id,object_type,created fromuser_objects whereobject_name='BIND_PROCESS_LOG_REFNO';

OBJECT_NAME                     OBJECT_ID OBJECT_TYPE     CREATED

------------------------------ ---------- --------------- -------------------

BIND_PROCESS_LOG_REFNO             369195 INDEX 2012/11/05 10:18:28

SQL>selectindex_name,index_type fromuser_indexes whereindex_name='BIND_PROCESS_LOG_REFNO';

INDEX_NAME                      INDEX_TYPE

------------------------------- -----------

BIND_PROCESS_LOG_REFNO          BITMAP

SQL>

发现,这个索引BIND_PROCESS_LOG_REFNO是位于EDI_MESSAGE_PROCESS_LOG这张表的REFNO字段上的一个位图索引,而且是2012/11/05 10:18:28创建的,也就是说是近期才创建的1个位图索引。

问题定位到这一步基本比较清晰了,产生enq: TX - row lock contention事件的原因就是上述的第2个可能原因:位图索引同时被更新或同时并发的向位图索引字段上插入相同字段值

8 那么,解决的办法也比较简单了,就是干掉这个位图索引,因为这个位图索引在这种应用场景下确实不太适合。事后,经过同客户方沟通确认,该索引是他们的一个DBA当初看到系统比较慢,而加上去的一个位图索引。

9补充,从当时的ADDM报告中,也可以看到数据库给我们的建议:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

FINDING 4: 20% impact (6013 seconds)

------------------------------------

发现 SQL 语句正处于行锁定等待。

RECOMMENDATION 1: Application Analysis, 17% benefit (5131 seconds)

ACTION: INDEX"SUNISCO.BIND_PROCESS_LOG_REFNO"(对象 ID 为 369195)

中检测到了严重的行争用。使用指定的阻塞 SQL 语句在应用程序逻辑中跟踪行争

用的起因。

RELEVANT OBJECT: databaseobject withid 369195

RATIONALE: SQL_ID "dr4uxu769tmmb"的 SQL 语句在行锁上被阻塞。

RELEVANT OBJECT: SQL statement withSQL_ID dr4uxu769tmmb

INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE,

SERVICE_STATUS, LOG_DATETIME, REFNO, REF_TYPE, MSG_ID, BL_NO, BL_ID,

VOYAGE_ID, VESSEL_NAME, IMO_NO, VOYAGE_NO, FUNCTION_TYPE, INPUT_DATE,

IN_STATUS, SYSTEM_TYPE, ERROR_LOG, FILE_NAME) VALUES( :B1 , :B2 ,

:B3 , :B4 , :B5 , :B6 , :B7 , :B8 , :B9 , :B10 , :B11 , :B12 , :B13 ,

:B14 , :B15 , :B16 , :B17 , :B18 , :B19 )

RATIONALE: SQL_ID "dxsbgubsb6r4n"的 SQL 语句在行锁上被阻塞。

RELEVANT OBJECT: SQL statement withSQL_ID dxsbgubsb6r4n

INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE,

SERVICE_STATUS, INFO_CODE, INFORMATION, INFO_LEVEL, LOG_DATETIME,

REFNO, REF_TYPE, MSG_ID, BL_NO, VOYAGE_ID, VESSEL_NAME, IMO_NO,

VOYAGE_NO, FUNCTION_TYPE, INPUT_DATE, IN_STATUS, SYSTEM_TYPE,

ERROR_LOG, FILE_NAME) VALUES( :B1 , :B2 , :B3 , :B4 , :B5 , :B6 ,

:B7 , :B8 , :B9 , :B10 , :B11 , :B12 , :B13 , :B14 , :B15 , :B16 ,

:B17 , :B18 , :B19 , :B20 , :B21 )

RATIONALE: SQL_ID "b38qhyzvn5bdd"的 SQL 语句在行锁上被阻塞。

RELEVANT OBJECT: SQL statement withSQL_ID b38qhyzvn5bdd

INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE,

SERVICE_STATUS, LOG_DATETIME, REFNO, REF_TYPE, MSG_ID, BL_NO,

VOYAGE_ID, VESSEL_NAME, IMO_NO, VOYAGE_NO, FUNCTION_TYPE, INPUT_DATE,

IN_STATUS, SYSTEM_TYPE, ERROR_LOG, FILE_NAME) VALUES( :B1 , :B2 ,

:B3 , :B4 , :B5 , :B6 , :B7 , :B8 , :B9 , :B10 , :B11 , :B12 , :B13 ,

:B14 , :B15 , :B16 , :B17 , :B18 )

RATIONALE: SQL_ID "36k2xpx3c6wr5"的 SQL 语句在行锁上被阻塞。

RELEVANT OBJECT: SQL statement withSQL_ID 36k2xpx3c6wr5

INSERTINTOEDI_MESSAGE_PROCESS_LOG(LOG_ID, SERVICE_TYPE,

SERVICE_STATUS, REFNO, REF_TYPE, MSG_ID, BL_NO, VOYAGE_ID,

VESSEL_NAME, IMO_NO, VOYAGE_NO, FUNCTION_TYPE, INPUT_DATE, IN_STATUS,

SYSTEM_TYPE, ERROR_LOG, FILE_NAME) VALUES( :B1 , :B2 , :B3 , :B4 ,

:B5 , :B6 , :B7 , :B8 , :B9 , :B10 , :B11 , :B12 , :B13 , :B14 , :B15

, :B16 , :B17 )

RATIONALE: 具有 ID "268", 用户 ID "31", 程序 "FC.EdiService.Import.exe"

模块

"FC.EdiService.Import.exe"的会话是构成此建议案中的优化建议的 51% 的阻

塞会话。

RATIONALE: 具有 ID "307", 用户 ID "31", 程序 "FC.EdiService.Import.exe"

模块

"FC.EdiService.Import.exe"的会话是构成此建议案中的优化建议的 11% 的阻

塞会话。

RATIONALE: 具有 ID "227", 用户 ID "31", 程序 "FC.EdiService.Import.exe"

模块

"FC.EdiService.Import.exe"的会话是构成此建议案中的优化建议的 11% 的阻

塞会话。

RATIONALE: 具有 ID "273", 用户 ID "31", 程序 "FC.EdiService.Import.exe"

模块

"FC.EdiService.Import.exe"的会话是构成此建议案中的优化建议的 9% 的阻塞

会话。

10 最后,从本案例中,可以看到在日常的数据库维护中,添加或修改一些对象信息时,务必要经过严格的测试,尤其是在生产系统上做调整更应如此。同样,可以看出,数据库的一些理论基础知识对于DBA还是蛮重要的。

AWR之-enq TX - row lock contention的性能故障-转的更多相关文章

  1. 解决一则enq: TX – row lock contention的性能故障

    上周二早上,收到项目组的一封邮件: 早上联代以下时间点用户有反馈EDI导入"假死",我们跟踪了EDI导入服务,服务是正常在跑,可能是处理的慢所以用户感觉是"假死" ...

  2. ORACLE AWR结合ASH诊断分析enq: TX - row lock contention

    公司用户反馈一系统在14:00~15:00(2016-08-16)这个时间段反应比较慢,于是生成了这个时间段的AWR报告, 如上所示,通过Elapsed Time和DB Time对比分析,可以看出在这 ...

  3. ORACLE等待事件:enq: TX - row lock contention

    enq: TX - row lock contention等待事件,这个是数据库里面一个比较常见的等待事件.enq是enqueue的缩写,它是一种保护共享资源的锁定机制,一个排队机制,先进先出(FIF ...

  4. 记录一则enq: TX - row lock contention的分析过程

    故障描述:与客户沟通,初步确认故障范围大概是在上午的8:30-10:30之间,反应故障现象是Tomcat的连接数满导致应用无法连接,数据库alert中无明显报错,需要协助排查原因. 1.导入包含故障时 ...

  5. Tuning “enq:TX – row lock contention” events

    enq是一种保护共享资源的锁定机制,一个排队机制 排它机制从一个事务的第一次改变直到rollback or commit 结束这个事务, TX等待mode是6,当一个session 在一个表的行级锁定 ...

  6. 大表建立索引引发enq: TX - row lock contention等待

    今天要给一张日志表(6000w数据)建立索引,导致生产系统行锁部分功能卡住 create index idx_tb_cid on tb_login_log(user_id); 开始执行后大概花费了20 ...

  7. enq: TX - row lock contention 参数P1,P2,P3说明

    enq: TX - row lock contention三个参数,例如,下面的等待事件 * P1 = name|mode          <<<<<<< ...

  8. [Oracle] enq: TX - row lock contention 优化案例

    依据开发反馈.近期每天早上7:30应用会报警.应用的日志显示数据库连接池满了.新的连接被拒绝. 首先.我做了ASH报告(报告区间:7:25 ~ 7:35),从ASH的等待事件发现enq: TX - r ...

  9. enq: TX - row lock contention“等待事件的处理

      enq: TX - row lock contention“等待事件的处理   session1: SQL> conn scott/triger Connected. SQL> CRE ...

随机推荐

  1. C# winform 获取当前路径

    // 获取程序的基目录. System.AppDomain.CurrentDomain.BaseDirectory// 获取模块的完整路径.System.Diagnostics.Process.Get ...

  2. (转)SCR, PCR, ESCR, PTS, DTS

    1.       SCR SCR是存在于PS中的,即PS的pack里面的一个field.他用来指定这个PS的pack期望的到达decoder的时间. 2.       ESCR ESCR是位于PES里 ...

  3. 2014Esri全球用户大会之影像和栅格

    1.现在Esri已将影像作为GIS解决方案的一部分,其详细战略部署是如何的? 在过去的十年.Esri有规划的在ArcGIS平台(主要为Desktop和Server)中管理和开发影像和栅格功能.这包含影 ...

  4. C++多线程环境下注意共享资源的释放顺序

    比如我现在写一个多线程下载程序,包含DownloadTask.HttpDownload两个类. class DownloadTask { //省略n行代码 public: int m_threads; ...

  5. 【Java面试题】40 你所知道的集合类都有哪些?主要方法?

    线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构.这些类均在java.util包中.本文试图通过简单的描述,向读者阐述各个类的作用以 ...

  6. Hbase1.1.0.1配置集群

    参考链接 http://wuyudong.com/archives/119?utm_source=tuicool 参考链接 http://www.cnblogs.com/archimedes/p/45 ...

  7. delphi程序热键

    要定义一个全局热键,通常有三个步骤:      1.定义Windows的消息WM_HOTKEY的HOOK链,即            procedure MyShortCut(Var Message: ...

  8. jquery的委托处理

     1.基本用法: javascript的事件模型,采用”冒泡”模式,也就是说,子元素的事件会逐级向上”冒泡”,成为父元素的事件. 利用这一点,可以大大简化事件的绑定.比如,有一个表格(table元素) ...

  9. 最新版ChemDraw 15.1 免费获取下载

    ChemDraw 15.1 Pro是最新版的ChemOffice套件的个人生产力工具,它可以帮助科学家有效地捕捉和分享工作内容,通过可视化功能对结果获得更深入的了解.现在为大家带来好消息,ChemOf ...

  10. MathType中常遇到的几个问题

    每次打开别人的论文,发现公式文字都排版得非常整齐,公式也编辑得非常漂亮,看起来就非常得赏心悦目.再打开自己的论文,一片凌乱,自己不想都再看,公式编辑得乱七八糟,符号不够规范,大小不够统一,你自己都觉得 ...