SQL Nexus
在前面的SQLdiag系列中有提到SQLNexus,当时我们用SQLNexus查看了Perfmon Summary(性能计数器)、ReadTrace Reports(跟踪文件)两项报表。SQLNexus将SQL跟踪数据、性能监视器日志以及各种T-SQL脚本的输出聚合到单个SQL Server数据库中。
这一篇将以生产环境中收集的数据来分析SQLNexus的各个报表。SQLdiag收集数据导入到SQLNexus后的总界面如下:
报表是否可用是根据对应数据表是否有记录来判断,下图是打开主界面的跟踪脚本运行的结果:
图中蓝底纹的数据表在库下没有创建,因此对应的报表不可用。可用报表数据来源文件如下:
1>Loaded Modules
数据来自*sp_sqldiag_Shutdown.OUT
2>Perfmon Summary
数据来自SQLDIAG.BLG
3>ReadTrace Reports
数据来自*sp_trace.trc
4>Missing Indexes/Indexes and Stats
数据来自*Perf_Stats_Snapshot_Startup.OUT
5>其他可用
数据来自*Perf_Stats_Startup.OUT
按照SQLdiag->PerfMon->Perf_Stats->Perf_Stats_Snapshot逐一导入数据,对比表中数据与收集文件中的数据,分析各文件对应数据表:
注意:Perfmon Summary报表数据展现需从[dbo].[tbl_XPMSVER]表取ProcessorCount,而[dbo].[tbl_XPMSVER]表的数据来自*sp_sqldiag_Shutdown.OUT。对于上述图片中Descript为空的表可以开启跟踪,查看表是如何创建以及如何导入数据。
Perfmon Summary、ReadTrace Reports参考之前的SQLdiag和RML文章,Blocking and Wait Statistics(阻塞和等待)报表界面如下:
Top Wait Categories的数据来自表tbl_OS_WAIT_STATS;Blocking Chains的数据来自表tbl_BLOCKING_CHAINS。
Bottleneck Analysis(瓶颈分析)报表界面如下:
System CPU Utilization的数据来自表tbl_SQL_CPU_HEALTH;Bottleneck Analysis大部分数据来自表tbl_OS_WAIT_STATS(sys.dm_os_wait_stats),注意底部的Wait Category项目的CPU项,过程描述是Add SOS_SCHEDULER_YIELD wait time (waiting to run on a CPU) to actual used CPU time to synthesize a "CPU" wait category.而Actual_used_CPU_time=[CPU个数(tbl_SYSINFO.cpu_count)*时间间隔(s)*平均CPU使用率(tbl_SQL_CPU_HEALTH.sql_cpu_utilization)*单位换算]
本例中Actual_used_CPU_time=2*11025*4%*1000=882000(ms),SOS_SCHEDULER_YIELD=235886(ms)
Other项是don't include the categories that we are already identifying in the top 5.SOS_SCHEDULER_YIELD也归结到Other项。Wait_Time(ms)_per_Sec=Total_Wait_Time_ms/Time_Interval_Sec,%Total_Wait_Time_ms=Single Total_Wait_Time_ms/Total Total_Wait_Time_ms.
因此表格中除CPU以外的项Total_Wait_Time_ms相加,对应是这段时间内sys.dm_os_wait_stats的增量。CPU是单独的项,我们移动鼠标到其上是不能跳转到明细数据的,其他项可以跳转到对应的Wait Details:
图中Wait over Time折线图对应中间的View Details,点开加号(+)可以查看详细快照数据:
明细来自表tbl_OS_WAIT_STATS(sys.dm_os_wait_stats)中特定wait_category的数据。Wait Details的下半部分数据来自表tbl_REQUESTS对应wait_category的数据,注意如果点击Bottleneck Analysis->Other,由于它传递的wait_category = 'Other',导致对应的Wait Details界面没有数据,实际应该传递wait_category not in(top 5)
Spinlock Statistics Report(自旋锁)界面如下:
自旋锁:类似闩锁(当数据页从磁盘读取前,数据库引擎会先在内存中预留适当的内存页,给这些内存加闩锁,数据才能顺利地读到内存。如果一个线程没法立即获得闩锁,线程则等待,让CPU给其他线程使用),不同闩锁的是:如果一个线程没法立即获得自旋锁,线程则开始轮询,重复检查资源是否可用以继续使用。当然也不会长时间轮询,不久就会让出CPU给其他线程使用。SQLSERVER选择让线程在CPU上稍微等一会(所谓自旋),而不是将CPU资源让出来。由于资源很快能够得到,这样处理能够减少CPU上线程的切换,更有效率(Windows也是这样做的减少线程切换的开销,经常切换线程上下文是很耗费CPU资源的)
对自旋锁故障排除的主要DMV是sys.dm_os_spinlock_stats。这个DMV里返回的每一行都代表SQL Server里的一个自旋锁。
select * from sys.dm_os_spinlock_stats
dbcc sqlperf(spinlockstats)
--name:自旋锁名称
--collision:当尝试访问保护的数据结构时,被自旋锁阻塞的线程次数
--spins:在循环里尝试获得自旋锁的自旋锁线程次数
--spins_per_collision:旋转和碰撞之间的比率
--sleep_time:因为退避线程休眠时间
--backoffs:为了其他线程在CPU上继续,线程退避次数
上述报表就是利用表tbl_SPINLOCKSTATS(sys.dm_os_spinlock_stats)最晚记录与最早记录的差值,计算指定时间内自旋锁申请和阻塞情况。
其他报表(Loaded Modules、Missing Indexes、Virtual File Stats 、Indexes and Stats、Memory Brokers)都是以表格形式返回数据,在此就不详细描述。附上部分SQL Nexus Reports调用过程/表:
----SQL Nexus Reports调用过程/表情况
/****Loaded Modules****/
if object_id('dbo.tbl_loaded_modules') is not null
begin
select * from tbl_loaded_modules
order by case when Company like 'Microsoft%' then 1 else 0 end, name
end /****Blocking and Wait Statistics****/
--Top Wait Categories
EXEC DataSet_WaitStatsMain_WaitStatsChart '2016-01-13T13:14:06.000', '2016-01-13T16:17:51.000'
EXEC DataSet_WaitStats_WaitStatsTop5Categories '2016-01-13T13:14:06.000', '2016-01-13T16:17:51.000'
--Blocking Chains
EXEC DataSet_WaitStats_BlockingChains '2016-01-13T13:14:06.000', '2016-01-13T16:17:51.000' /****Bottleneck Analysis****/
--System CPU Utilization
SELECT EventTime,record_id, system_idle_cpu, sql_cpu_utilization, 100 - sql_cpu_utilization - system_idle_cpu AS nonsql_cpu_utilization
FROM tbl_SQL_CPU_HEALTH
WHERE EventTime >= '2016-01-13T13:14:06.000'
ORDER BY EventTime
--Bottleneck Analysis
EXEC DataSet_WaitStats_WaitStatsTop5Categories '2016-01-13T13:14:06.000', '2016-01-13T16:17:51.000' /****Missing Indexes****/
if object_id('tbl_missingindexes') is not null
select top 20 Create_index_statement, improvement_measure, user_seeks, user_scans
from tbl_missingindexes
order by improvement_measure DESC /****Virtual File Stats****/
if object_id('dbo.DataSet_GetSnapshot') is not null
begin
exec DataSet_GetSnapshot 'tbl_FileStats', 178
end /****Indexes and Stats****/
--Index and Statistics Summary
select dbid, MAX(row_mods) 'MaxRowMods', MIN(stats_updated) 'EarliestStatsUpdated', MAX(stats_updated) 'LatestStatsUpdated', COUNT (case when norecompute<>'no' then 1 else null end) 'NumberOfNoRecmpute'
from tbl_SysIndexes
group by dbid
order by CAST(dbid as int)
--Index and Statistics Details
select dbid, objname, type, idxname, stats_updated, [norecompute] from tbl_SysIndexes
order by CAST(dbid as int), cast (stats_updated as datetime)
代码仅仅大致提取跟踪脚本,详细逻辑请自行参考实例跟踪。
SQL Nexus的更多相关文章
- SQL Server 2012内部原理及故障排除(专栏)
PROFESSIONAL SQL SERVER® 2012 INTERNALS AND TROUBLESHOOTING一书(可从这里下载).认为内容非常不错.自己也想对SQL Server 2012有 ...
- The Accidental DBA
The Accidental DBA (Day 1 of 30): Hardware Selection: CPU and Memory Considerations 本文大意: 全篇主要讲 ...
- 内存中 OLTP - 常见的工作负荷模式和迁移注意事项(三)
----------------------------我是分割线------------------------------- 本文翻译自微软白皮书<In-Memory OLTP – Comm ...
- SQLdiag-配置文件-扩展
CustomDiagnostics在我们第一次双击D:\Program Files\Microsoft SQL Server\100\Tools\Binn目录下的SQLdiag.exe应用程序所收集的 ...
- SQLdiag-配置文件-ProfilerCollector
上一篇,我们讲述了配置文件中与性能计数器相关的PerfmonCollector元素:这一篇我们将讲述与跟踪数据相关的ProfilerCollector元素.在上一篇中使用SD_Detailed.XML ...
- SQLdiag-配置文件-PerfmonCollector
前一篇我们已经使用默认配置文件收集了部分诊断数据,并且知道配置文件会影响收集数据的内容.这一篇我们重点讲述配置文件中与性能计数器相关的操作.可使用XML模板控制SQLdiag使用的收集器.每个收集器可 ...
- debugging tools
https://blogs.msdn.microsoft.com/debugdiag/ https://blogs.msdn.microsoft.com/debuggingtoolbox/2012/1 ...
- 集腋成裘-11-sql性能优化
SQL Nexus是一个用于将SQL Trace数据.性能监视日志及T-SQL输出整合进一个单独的SQL Server数据库的工具. 先决条件 开始使用SQL Nexus之前,注意下面要做的事项: 安 ...
- 【监控笔记】【1.4】Pssdiag和Sqldiag管理器
--没有实操过,有点复杂,先写上以后有用到再深入研究 统计与诊断数据是任何 SQL故障修复工作的关键所在. 如果没有掌握这些数据,就无法确定数据性能问题的根源.数据表的瓶颈可能并不是由索引问题造成的: ...
随机推荐
- Mongoose简单学习笔记
1.1 名词解释 Schema : 一种以文件形式存储的数据库模型骨架,不具备数据库的操作能力 Model : 由Schema发布生成的模型,具有抽象属性和行为的数据库操作对 Entity : 由Mo ...
- BZOJ 1468 & 点分治
题意: 带权树,求距离小于k的点对数目. SOL: 参考http://blog.csdn.net/jiangshibiao/article/details/25738041解决了题意问题... 代码是 ...
- HDU 3089 (快速约瑟夫环)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3089 题目大意:一共n人.从1号开始,每k个人T掉.问最后的人.n超大. 解题思路: 除去超大的n之 ...
- [知识点]KMP算法
// 此博文为迁移而来,写于2015年5月24日,不代表本人现在的观点与看法.原始地址:http://blog.sina.com.cn/s/blog_6022c4720102w1iw.html 1.前 ...
- BZOJ 1054 题解
1054: [HAOI2008]移动玩具 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 1888 Solved: 1035[Submit][Stat ...
- linux命令之 top, free,ps
linux终端查看cpu和内存使用情况 t一.op进入全屏实时系统资源使用信息查看 PID:进程的ID USER:进程所有者 PR:进程的优先级别,越小越优先被执行 NInice:值 VIRT:进程占 ...
- RSA_RSA算法原理(一)
如果你问我,哪一种算法最重要?我可能会回答"公钥加密算法". 因为它是计算机通信安全的基石,保证了加密数据不会被破解.你可以想象一下,信用卡交易被破解的后果. 进入正题之前,我先简 ...
- SQLSERVER远程备份、恢复(转)
SQLSERVER服务实例名称:192.168.0.2需要备份的数据库名称: a备份机器名称(Client端):192.168.0.3备份机用户:zf 密码:123备份机域名:domain备份机提供备 ...
- 纪念逝去的岁月——C/C++排序二叉树
1.代码 2.运行结果 3.分析 1.代码 #include <stdio.h> #include <stdlib.h> typedef struct _Node { int ...
- 一个简单的零配置命令行HTTP服务器 - http-server (nodeJs)
http-server 是一个简单的零配置命令行HTTP服务器, 基于 nodeJs. 如果你不想重复的写 nodeJs 的 web-server.js, 则可以使用这个. 安装 (全局安装加 -g) ...