使用线程统计信息(Thread Statistics)

可在session log中使用线程统计信息来判断source，target或组的性能瓶颈
默认情况下，Integration Service在运行session时，使用一个reader thread，一个transformation thread，还有一个writer thread
如果其中一个thread有非常高的busy percentage，则说明该部分可能有性能上的瓶颈

session log中提供以下几个线程相关的信息：

　　Run time:
　　　　运行时间，即thread运行的总时间

　　Idle time:
　　　　空闲时间，即thread运行的空闲时间，它包括了thread等待其他thread处理的时间
　　　　空闲时间包括的是thread被Integration Service锁定的时间，而不是被操作系统锁定的时间

　　Busy time:
　　　　工作时间，即工作时间占总运行时间的百分比
　　　　公式：(run time - idle time) / run time X 100
　　　　如果总的运行时间非常短，如60秒以内，则可以忽略，因为这么短的时间不足以判定为性能上的瓶颈

　　Thread work time:
　　　　Integration Service处理运行组件所花费的时间
　　　　在session log中，使用如下格式显示，如果组件花费的时间不长，则它是不会出现在session log中的
　　　　　　Thread work time breakdown:
　　　　　　　　<transformation name>: <number> percent
　　　　　　　　<transformation name>: <number> percent
　　　　　　　　<transformation name>: <number> percent

　　　　如果在session log中，thread没有准确的统计信息，则说明session运行的时间很短，因此在session log中会提示统计信息不准确

评估性能瓶颈
　　使用线程统计信息评估性能瓶颈，主要通过以下几点：
　　　　1 如果reader和writer线程的Busy time是100%，可以考虑在source和target中使用string类型，因为针对非string类型需额外处理
　　　　2 如果某一组件的work time是100%，可以考虑在segment中追加一个分区点
　　　　　当向mapping追加一个分区点时，Integration Service会在session运行时增加处理该组件的线程数
　　　　　但如果所在机器的内存已达到或者接近满负荷状态，则不要进行该操作
　　　　3 如果一个组件需要比其他组件更多的处理时间，则可考虑为该组件追加一个pass-through partition point

实例

当运行session，session log中关于线程相关的信息会像如下：

***** RUN INFO FOR TGT LOAD ORDER GROUP [], CONCURRENT SET [] *****

Thread [READER_1_1_1] created for [the read stage] of partition point [SQ_two_gig_file_32B_rows] has completed.

    Total Run Time = [505.871140] secs

    Total Idle Time = [457.038313] secs

    Busy Percentage = [9.653215]

Thread [TRANSF_1_1_1] created for [the transformation stage] of partition point [SQ_two_gig_file_32B_rows] has completed.

    Total Run Time = [506.230461] secs

    Total Idle Time = [1.390318] secs

    Busy Percentage = [99.725359]

    Thread work time breakdown:

        LKP_ADDRESS: 25.000000 percent

        SRT_ADDRESS: 21.551724 percent

        RTR_ZIP_CODE: 53.448276 percent

Thread [WRITER_1_*_1] created for [the write stage] of partition point [scratch_out_32B] has completed.

    Total Run Time = [507.027212] secs

    Total Idle Time = [384.632435] secs

    Busy Percentage = [24.139686]

log中包含了如下信息：

 运行transformation的总体时间是506秒，工作时间是99.%，可得知transformation thread几乎没有空闲时间，因此可判定transformation是该session的性能瓶颈

 reader thread和writer thread的的工作时间分别为9%和24%，可得知空闲的时间占了大部分，因此可判定reader和writter并不存在性能瓶颈

 关于判定transformation中是哪个组件导致性能问题，可参考Thread work time breakdown列表，可看到组件RTR_ZIP_CODE的工作时间最高，是53%，因此可针对此组件调

使用线程统计信息(Thread Statistics)的更多相关文章

SQL Server读懂语句运行的统计信息 SET STATISTICS TIME IO PROFILE ON
对于语句的运行,除了执行计划本身,还有一些其他因素要考虑,例如语句的编译时间.执行时间.做了多少次磁盘读等. 如果DBA能够把问题语句单独测试运行,可以在运行前打开下面这三个开关,收集语句运行的统计信 ...
SQL SERVER 统计信息概述(Statistics)
前言查询优化器使用统计信息来创建可提高查询性能的查询计划,对于大多数查询,查询优化器已经为高质量查询计划生成必要的统计信息,但是在少数情况下,您需要创建附加的统计信息或者修改查询设计以得到最佳结果. ...
（3.14） set statistics io/time/profile /SET SHOWPLAN_ALL ON详解统计信息与执行计划
SQL Server读懂语句运行的统计信息 SET STATISTICS TIME IO PROFILE ON 执行计划详细描述请参考(读懂执行计划) 对于语句的运行,除了执行计划本身,还有一些其他 ...
SQL Server 统计信息(Statistics)-概念,原理,应用,维护
前言:统计信息作为sql server优化器生成执行计划的重要参考,需要数据库开发人员,数据库管理员对其有一定的理解,从而合理高效的应用,管理. 第一部分概念统计信息(statistics):描述 ...
通过手动创建统计信息优化sql查询性能案例
本质原因在于:SQL Server 统计信息只包含复合索引的第一个列的信息,而不包含复合索引数据组合的信息来源于工作中的一个实际问题, 这里是组合列数据不均匀导致查询无法预估数据行数,从而导致无法选 ...
MS SQL 统计信息浅析上篇
统计信息概念统计信息是一些对象,这些对象包含在表或索引视图中一列或多列中的数据分布有关的统计信息.数据库查询优化器使用这些统计信息来估计查询结果中的基数或行数. 通过这些基数估计,查询优化器可以生成 ...
SQL语句调优 - 统计信息的含义与作用及维护计算
统计信息的含义与作用 ...
第十二章——SQLServer统计信息（1）——创建和更新统计信息
原文:第十二章--SQLServer统计信息(1)--创建和更新统计信息简介: 查询的统计信息: 目前为止,已经介绍了选择索引.维护索引.如果有合适的索引并实时更新统计信息,那么优化器会选择有用的索 ...
SQL SERVER的统计信息
1 什么是统计信息统计信息描述了表格或者索引视图中的某些列的值的分布情况,属于数据库对象.根据统计信息,查询优化器就能评估查询过程中需要读取的行数及结果集情况,同时也能创建高质量的查询 ...

随机推荐

Isight 命令行运行任务
说明书参考:https://abaqus-docs.mit.edu/2017/English/DSSIMULIA_Established.htm 不一定对版本.但是大部分还可以. 不对的可以在命令里敲 ...
navicat for mysql 连接报错1251详细解决步骤
我的是8.0的版本,因为比较新的mysql采用新的保密方式所以旧的似乎不能用,改密码方式:use mysql:ALTER USER 'root'@'localhost' IDENTIFIED WITH ...
css关于浮动的高度塌陷
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
squid 透明代理配置
阿铭在教程中已经介绍过squid的安装和配置,http://study.lishiming.net/chapter22.html 教程中只介绍了初级的正向代理和反向代理,这篇文档将要介绍透明代理如何配 ...
Naïve Media Player
我的GitHub链接:https://github.com/Joyce45/hwt 一.播放器?怎么做? 提到播放器,首先想到的就是XAML控件库里的MediaElement,于是我又大致阅读了一下该 ...
初入pygame——贪吃蛇
一.问题利用pygame进行游戏的编写,做一些简单的游戏比如贪吃蛇,连连看等,后期做完会把代码托管. 二.解决 1.环境配置 python提供一个pygame的库来进行游戏的编写.首先是安装pygam ...
HTML5调用手机的Datepicker(日期选择器)
HTML5 拥有多个新的表单输入类型.这些新特性提供了更好的输入控制和验证,包含了如下新的输入类型: email url number range Date pickers (date, month, ...
《Linux就该这么学》第十七天课程
想学Squid可以前往https://www.linuxprobe.com/chapter-16.html讲的非常细 Squid服务程序提供正向代理服务 Squid服务程序提供的反向代理模式
MongoDB的数据备份与恢复
一:数据备份操作步骤: 1.以管理员身份打开cmd,然后打开到mongdb的bin文件夹 2.输入命令 mongodump -h dbhost -d dbname -o dbdirectory -h ...
(24)How generational stereotypes hold us back at work
https://www.ted.com/talks/leah_georges_how_generational_stereotypes_hold_us_back_at_work/transcript ...

使用线程统计信息(Thread Statistics)

使用线程统计信息(Thread Statistics)的更多相关文章

随机推荐

热门专题