转载:http://www.cnblogs.com/fygh/archive/2012/01/17/2324926.html

查看语句运行时间异常的原因(SQLServer)

 

经常有开发同事反映如下情况:我有一条语句或者一个JOB昨天跑半个小时就完成了,今天怎么跑了两个小时还没有完成?

是不是数据库出现问题了?

数据库语句运行时间异常,其实是一个比较复杂的情况,因为数据是不断变动的,今天好好的一条语句,有可能明天运行就

不在预计的时间内了,这个场景是没办法完全重溯的,即便有当时的备份数据,但是当时的服务器压力是没有办法知道和营造

的;但是好在现在不是要调查昨天语句跑时间异常的原因,而是要找到现在语句运行异常的原因,现在的情况还正在进行着呢,

所以我们可以根据语句目前的情况,初步来排查一下;

其实要考虑的问题比较多:

1. 索引是否正常(索引是否损坏、有没有人删除索引等);

2. 统计信息是否过时;

3. 语句执行计划是否发生偏移(和索引、统计信息以及数据量都有关系);

4. 语句是否有bug;

5. 是否发生的阻塞;

6. 系统资源是否遇到瓶颈;

.........

这么多的情况都考虑的话我们很难下手,一般解决这个问题我们都需要采用比较快的方式来做排查,以下方法主要针对5和6两

个方面进行,因为这两个方面是最常见的情况。

我们来简单模拟一下排查过程:

1. 创建测试表和数据

USE [master]

GO /****** Object: Table [dbo].[a] Script Date: 01/17/2012 16:46:34 ******/

SET ANSI_NULLS ON

GO SET QUOTED_IDENTIFIER ON

GO SET ANSI_PADDING ON

GO CREATE TABLE [dbo].[a](

[id] [int] IDENTITY(1,1) NOT NULL,

[name] [varchar](100) NULL

) ON [PRIMARY] GO SET ANSI_PADDING OFF

GO insert into a values('aa'),('bb'),('cc')

2. 制造阻塞:开两个session,分别运行下面的语句

--Session 1
use master

go

begin tran

update A set name='abc' where id=2 --rollback

--Session 2
select * from a

因为Session1 的Update语句没有能够提交,所以此时Session2 过程会被阻塞

3. 分析排查:

我们首先需要查询下此时数据库中是否存在阻塞:

--Blocked
select * from sys.sysprocesses with(nolock) where blocked<>0


 我们看到了阻塞的记录,53阻塞了56,被阻塞的资源是:dbid 1 file 1 page 307;

接下来我们需要知道阻塞和被阻塞的是什么语句,有两种方式:

a. dbcc inputbuffer

b. sys.dm_exec_sql_text

方法一与方法二相比:

优点:方法一能显示非活动session的语句,方法二只能查活动的session(通过sp_who2 active 能显示是否活动);

缺点:方法一只能一个一个查询,方法二可以多个一起查询;

方法一:

--No1:
dbcc inputbuffer(53)

go

dbcc inputbuffer(56)

方法二:

--No2:
SELECT

S.session_id, R.blocking_session_id,

S.host_name, S.login_name,

databaseName=DB_NAME(R.database_id),R.command, R.status,

current_execute_sql = SUBSTRING(T.text,

R.statement_start_offset / 2 + 1,

CASE

WHEN statement_end_offset = -1 THEN LEN(T.text)

ELSE (R.statement_end_offset - statement_start_offset) / 2+1

END),

S.program_name,

S.status,

S.cpu_time, memory_usage_kb = S.memory_usage * 8, S.reads, S.writes,

S.transaction_isolation_level,

C.connect_time, C.last_read, C.last_write,

C.net_transport, C.client_net_address, C.client_tcp_port, C.local_tcp_port,

R.start_time,

R.wait_time, R.wait_type, R.last_wait_type, R.wait_resource,

R.open_transaction_count, R.transaction_id FROM sys.dm_exec_sessions S

LEFT JOIN sys.dm_exec_connections C

ON S.session_id = C.session_id

LEFT JOIN sys.dm_exec_requests R

ON S.session_id = R.session_id

AND C.connection_id = R.connection_id

OUTER APPLY sys.dm_exec_sql_text(R.sql_handle) T

WHERE S.is_user_process = 1 -- 如果不限制此条件,则查询所有进程(系统和用户进程)
and s.session_id in(53,56)

我们看到方法一两条语句都能查出来,而方法二只能查出一个语句;

到这里,我们已经能判断语句运行慢的原因是被阻塞了,我们再来查查阻塞的原因是什么,可以通过以下语句查看:

select request_session_id,resource_type,db_name(resource_database_id) as DBName,resource_description,

request_mode,request_type,request_status from sys.dm_tran_locks where request_session_id in(56,53)

order by request_session_id

可以看到,56处于WAIT状态,它在等待获取1:307:1 上的一个共享锁,但是1:307:1上被53的一个排他锁占据了(GRANT代表

已获得资源,正在运行),因此56必须等待53上的排他锁释放后才能继续运行;于是我们转而调查53排他锁没有释放的原因;可能是

53需要的其他资源被其他进程占有了,在等待其他进程释放锁;也可能是因为Update语句更新的数据量过多,需要的时间比较长,不

能够及时的释放锁;还有就是我们现在的情况,没有提交事物了(语句中可以直接看到);阻塞的排查方法都是类似的。

如果语句并没有被其他语句blocked呢? 那我们需要再进一步查找的原因就是Wait了,前面已经有wait的相关查询,下面我们来查下

更具体的信息:

-- wait & lock
select lo.request_session_id as [Session],

DB_NAME(lo.resource_database_id) as Dbname,

lo.resource_type as [Type],

lo.resource_description,

lo.request_mode,

lo.request_owner_type,

lo.request_status,

case when lo.resource_type='OBJECT' then OBJECT_NAME(lo.resource_associated_entity_id)

when lo.resource_associated_entity_id IS NULL OR lo.resource_associated_entity_id=0

then NULL

else OBJECT_NAME(p.object_id)

end as Associated_Entity,

wt.blocking_session_id,wt.resource_description

from

sys.dm_tran_locks lo with(nolock)

left join sys.partitions p with(nolock)

on lo.resource_associated_entity_id=p.partition_id

left join sys.dm_os_waiting_tasks wt with(nolock)

on lo.lock_owner_address=wt.resource_address

where lo.request_session_id>50

and lo.request_session_id=56

order by [Session] ,[TYPE]

上面可以看到,56在获取共享资源1:307:1时,遇到了等待,当然这里的等待还是被53阻塞了,但是等待会有多种原因的等待,我们查

一下当前的等待信息:

--current wait info
select wait_type,COUNT(0) as num_waiting_tasks,

SUM(wait_duration_ms) as total_wait_time_ms

from sys.dm_os_waiting_tasks with(nolock)

where session_id>50

group by wait_type

order by wait_type

这里可以看到是锁等待(Wait_Type),还有很多资源类型的等待,值的重点关注的有:
  Memory:CMEMTHREAD ,RESOURCE_SEMAPHORE
     CMEMTHREAD:
       说明和原因:计划缓存出现问题的标志(大量计划加入或者移出);
       解决:     使用参数化的查询或者设置数据库强制参数化(forced parameterization)

RESOURCE_SEMAPHORE:
       说明和原因:内存密集型查询无法获得请求的内存;其他进程消耗了太多的内存;
       解决:     为数据库添加合适的索引或者增加内存

IO:IO_COMPLETION,ASYNC_IO_COMPLETION,WRITELOG,PAGEIOLATCH_*

CPU: CXPACKET,SOS_SCHEDULER_YIELD
       CXPACKET:
          说明和原因:并行处理等待类型,并行同步等待;
          解决:     可以通过修改并行度的值(或者禁用)解决;
       SOS_SCHEDULER_YIELD:
          说明和原因:任务执行到时间片尾,让出调度器给其他任务运行;
          解决:     需要处理能力更好的CPU
 
  Network:ASYNC_NETWORK_IO,DBMIRROR_SEND
       ASYNC_NETWORK_IO: 网卡带宽饱和或者客户端不能及时把结果取走;
       DBMIRROR_SEND:  网络带宽不足以支持镜像事务量或者镜像数据库超出限额;

锁阻塞:LCK_*

我们可以统计下,我们数据库最多的20种等待类型:

--total wait info
select top 20 wait_type,SUM(waiting_tasks_count) waiting_tasks_count,

SUM(wait_time_ms)as total_wait_time_ms,

SUM(signal_wait_time_ms) as total_signal_wait_time_ms

from sys.dm_os_wait_stats with(nolock)

where wait_type not in

--system wait type
('LAZYWRITER_SLEEP','REQUEST_FOR_DEADLOCK_SEARCH','SQLTRACE_BUFFER_FLUSH',

'XE_TIMER_EVENT','FT_IFTS_SCHEDULER_IDLE_WAIT','LOGMGR_QUEUE','CHECKPOINT_QUEUE',

'SLEEP_TASK','BROKER_IO_FLUSH','BROKER_TASK_STOP','BROKER_TO_FLUSH','BROKER_EVENTHANDLER')

group by wait_type

order by total_wait_time_ms desc

通过这个我们可以从中看出DB等待主要集中在哪些方面,如果是在CPU、IO、Memory、Lock等上面等待时间很长,说明我们

的数据库需要做某些方面的优化了。

以上就是从阻塞和等待方面,对运行时间异常的语句做初步排查的过程,欢迎大家拍砖。

查看语句运行时间异常的原因(SQLServer)的更多相关文章

  1. MSSQL优化之——查看语句执行情况

    MSSQL优化之——查看语句执行情况 在写SQL语句时,必须知道语句的执行情况才能对此作出优化.了解SQL语句的执行情况是每个写程序的人必不可少缺的能力.下面是对查询语句执行情况的方法介绍. 一.设置 ...

  2. JDBC 异常特殊原因 (数据库只读解决办法)

    JDBC 异常特殊原因   有时候并不是因为程序写的有问题  ,是因为  数据库只读 在sqlserver2005中附加数据库时,附加的数据库会变成只读的,只能进行查询操作. 解决方法: 1 打开Sq ...

  3. 2019.12.11 java程序中几种常见的异常以及出现此异常的原因

    1.java.lang.NullpointerException(空指针异常) 原因:这个异常经常遇到,异常的原因是程序中有空指针,即程序中调用了未经初始化的对象或者是不存在的对象. 经常出现在创建对 ...

  4. 监控SQL:执行表中所有sql语句、记录每个语句运行时间(3)

    原文:监控SQL:执行表中所有sql语句.记录每个语句运行时间(3) 通过执行一个 带参数的存储过程  exec  OpreateTB('OpreateUser','IsRun')  更新表的数据 表 ...

  5. NIOS II CPU复位异常的原因及解决方案

    NIOS II CPU复位异常的原因及解决方案   近期在用nios ii做项目时,发现一个奇怪的现象,在NIOS II EDS软件中编写好的代码,烧写到芯片中,第一次能够正常运行,但是当我按下板卡上 ...

  6. 利用 SQL Monitor 查看语句运行状态步骤

    利用 SQL Monitor 查看语句运行状态步骤 1.确定语句被 SQL Monitor 监控 SQL> SELECT * FROM GV$SQL_MONITOR WHERE sql_id=' ...

  7. Ubuntu 使用top/free查看内存占用大的原因

    Ubuntu 使用top/free查看内存占用大的原因     linux/ubuntu下free/top查看内存占用大的原因 使用free/top查看内存占用的时候,吓了一大跳,机器4GB的内存,显 ...

  8. .net Monitor产生SynchronizationLockException异常的原因

    有时在使用Monitor进行并发同步编程时,会产生SynchronizationLockException异常,抛出的异常内容是"Object synchronization method ...

  9. linux重启查看日志及历史记录 查询原因

    linux重启查看日志及历史记录 查询原因 linux系统文件通常在/var/log中下面是对下面常出现的文件进行解释 /var/log/message ----------------------- ...

随机推荐

  1. Ubuntu中设置永久的DNS

    通过修改: sudo vi /etc/resolvconf/resolv.conf.d/base(这个文件默认是空的) 在里面插入:nameserver 8.8.8.8nameserver 8.8.4 ...

  2. ESB数据采集思路

    昨天接到一个任务,使用公司的ESB,调用别人的接口,把得到的数据存储到mysql数据库当中,这里简单记录解决思路,方便以后查看. 1.拿到一个网站的地址,使用火狐浏览器的firebug工具,查看其传递 ...

  3. 10款让人惊叹的HTML5/jQuery图片动画特效

    1.HTML5相册照片浏览器 可连接Flickr照片服务 以前我们经常会分享一些jQuery相册浏览插件,效果不错,实用性也很强.不过如果能利用HTML5来实现相册浏览器,那么相册浏览效果肯定会更加炫 ...

  4. AngularJS中的MVC模式

    MVC根据逻辑关系,把前端项目的代码分为三个层次 model:模型,就是业务数据,前端项目中就是JS变量. view:视图,就是业务数据在用户面前的展现,前端项目中就是HTML. controller ...

  5. mysql颠覆实战笔记(一)--设计一个项目需求,灌入一万数据先

    版权声明:笔记整理者亡命小卒热爱自由,崇尚分享.但是本笔记源自www.jtthink.com(程序员在囧途)沈逸老师的<web级mysql颠覆实战课程 >.如需转载请尊重老师劳动,保留沈逸 ...

  6. activiti搭建(一)初始化数据库

    转载请注明源地址:http://www.cnblogs.com/lighten/p/5876681.html activiti-engine.jar包中自带了创建activiti工作流数据库表的SQL ...

  7. 12个git实战建议和技巧

    摘要:git无疑是现在最热门的版本控制工具,而且正在进一步侵占SVN以及CVS的市场.本文作者从国外技术问答社区Stack Overflow整理的12个很实用的git使用技巧和建议,希望对你有帮助. ...

  8. 如何修改 Discuz 门户文章页默认视频大小

    在 Discuz 系统中,论坛插入 Flash 等可以输入自定义的尺寸,但是门户文章页不可以修改.经过一番研究,找到了修改门户文章页默认视频大小的方法如下,希望对你有用:找到:/source/func ...

  9. Sending Email from mailx Command in Linux Using Gmail’s SMTP

    The mailx or mail command in Linux is still providing service for guys like me, especially when we n ...

  10. backbone collection add 事件回调参数

    this.listenTo(this.collection, 'add', this.renderBook); renderBook: function (item) { var bookView = ...