SHAREDPOOL使用率的监控部署及思考
【系统环境】:
系统环境:Sun Solaris10 U11 + ORACLE 11.2.0.4.0 RAC
【背景描述】:
从2016年11月起,生产的数据库期的出现了两次m0001进程120秒无法启动:
主要报错:waiting for 0x3800fe418 Child shared pool level=7 child#=2,引起数据库异常的故障。专家分析得出的结论:统计收集作业触发shared pool空间需求,并出现收缩与扩容操作,先收缩说明shared pool空间容量不足或碎片严重导致无法找到可以使用的内存。当shared pool空间不足和存在碎片时会触发空间收缩与扩容。
由于目前没有数据去证明专家们的论点,只有在下一次故障重现时收集相关数据,则需要考虑怎么样去收集数据去证明专家的论点。
【监控前情况】
统计收集作业触发shared pool空间需求,并出现收缩与扩容操作,先收缩说明shared pool空间容量不足或碎片严重导致无法找到可以使用的内存。当shared pool空间不足和存在碎片时会触发空间收缩与扩容。则需要对SHAREDPOOL使用情况进行监控。
对于表设计想法:
1,由于该数据库的SHAREDPOOL使用情况查看方法很多种,怎样更直观体现SHAREDPOOL的使用情况,确认用百分比及总空间和剩余空间进行监控SHAREDPOOL;
2,存放数据应该存放监控数据的表空间AUDIT_DATA不影响应用使用的表空间,考虑到该数据库存储不足不能扩容,更容易分析时间段的数据,基于该条件情况下对表进行生命周期管理,则应该创建月分区表CHECK_SHAREDPOOL。
创建监控CHECK_SHAREDPOOL分区表:
CREATE TABLE XJ_EXP_DATA. CHECK_SHAREDPOOL
(INST_ID NUMBER,
"Free_Shared_Pool(MB)" NUMBER,
"Total_Shared_Pool(MB)" NUMBER,
FREEPCT VARCHAR2(10),
SAMPLE_TIME DATE DEDAULT SYSDATE)
PARTITION BY RANGE (SAMPLE_TIME)(
PARTITION P201701 VALUES LESS THAN (TIMESTAMP '2017-01 00:00:00') ,
PARTITION P201702 VALUES LESS THAN (TIMESTAMP '2017-02 00:00:00') ,
..........----省略其他分区语句
PARTITION PMAX VALUES LESS THAN (MAXVALUE) )
TABLESPACE AUDIT_DATA;
对于部署想法:
1,考虑到SHAREDPOOL的使用情况,数据库的每个节点都不一样,则需要每个节点都需要部署任务进行监控SHAREDPOOL;
2,考虑到对数据库SHAREDPOOL监控数据需要测试监控的可行性,则在对应生产的测试库进行测试监控三天查看监控情况;
3,考虑到数据的监控需求性,记录监控数据是否准确,定制采集数据频率为一小时;
在测试库测试该监控情况正常后,则誊写方案,内部审核后,提单对生产库进行部署SHAREDPOOL监控脚本及定时任务。
【监控优化】
对其生产监控SHAREDPOOL最后生成数据效果如下:

中间监控优化步骤如下:
1,SQL的优化:考虑到需要同时对比两个节点的SHAREDPOOL使用情况。则需要SQL查询组合多个节点数据;
2,采集数据优化:对于生产库比较多,需求每天提供监控SHAREDPOOL使用情况数据,有时突然需求SHAREDPOOL的使用情况,则考虑用监控主机使用PYAHON进行采集数据;
3,图形优化:考虑更加直观查看SHAREDPOOL的使用情况趋势,想到南基采数据库周报数据也是用PYTHON,则用PYTHON直接生成图形监控数据;
vi sharedpool.py
# -*- coding:UTF-8 -*-
import xlsxwriter, cx_Oracle, sys
reload(sys)
sys.setdefaultencoding('utf-8')
database_list = {'DEVDB': 'xj_exp_data/xxxx @172.16.85.1:1521/YYDB',
...........-----------添加连接多个数据库}
for d in database_list:
print(d)
conn = cx_Oracle.connect(database_list[d])
# connect_database
c = conn.cursor() #get cursor
x = c.execute('''
SELECT s.SNAP_TIME,s.INST_ID1,s.INST_ID2,d.NAME,s.TOTAL_MB_INST1,s.FREE_MB_INST1,
s.TOTAL_MB_INST2,s.FREE_MB_INST2
FROM (SELECT a.SNAP_TIME,a.PCT INST_ID1,b.PTC INST_ID2,a.TOTAL_MB TOTAL_MB_INST1,a.FREE_MB FREE_MB_INST1,b.TOTAL_MB TOTAL_MB_INST2,b.FREE_MB FREE_MB_INST2 from
(select to_char(trunc(SAMPLE_TIME +10/60/24, 'hh24'),'yyyymmdd_hh24') snap_time,INST_ID,"Free_Shared_Pool(MB)" free_mb,"Total_Shared_Pool(MB)" total_mb,to_number(replace(FREEPCT, '%', '')) pct
from XJ_EXP_DATA.CHECK_SHAREDPOOL PARTITION (P201703) where INST_ID = 1) a
left join ..............-------添加多个节点内容
left join (select to_char(trunc(SAMPLE_TIME +10/60/24, 'hh24'),'yyyymmdd_hh24') snap_time,INST_ID, "Free_Shared_Pool(MB)" free_mb,"Total_Shared_Pool(MB)" total_mb,to_number(replace(FREEPCT, '%', '')) pct
from XJ_EXP_DATA.CHECK_SHAREDPOOL PARTITION (P201703) where INST_ID = 2) b
on a.snap_time = b.snap_time(+)order by to_date(a.snap_time, 'yyyymmdd hh24')) s,
(select NAME from v$DATABASE) d ------用以识别多个数据库
''')
dbname = x.fetchone()[3]
row = x.fetchall()
..........--------省略部分内容
# Add a chart title and some axis labels.
chart1.set_title({'name': dbname + '一天数据库sharedpool监控'})
# Set an Excel chart style. Colors with white outline and shadow.
chart1.set_style(10)
# Insert the chart into the worksheet (with an offset).
worksheet.insert_chart('G2', chart1, {'x_offset': 25, 'y_offset': 10})
c.close()
conn.close()
workbook.close()
【总结】:
1,监控数据库的项目时,同时考虑是否多个节点数据一样。
2,对于多个数据库监控,PYTHON有非常大的帮助。
SHAREDPOOL使用率的监控部署及思考的更多相关文章
- zabbix监控-部署(一)
zabbix之自动化监控-部署篇(一) 标签(空格分隔): linux 笔者Q:972581034 交流群:605799367.有任何疑问可与笔者或加群交流 浅谈监控 监控命令 查看硬件的温度/风扇转 ...
- zabbix分布式监控部署--技术流ken
前言 zabbix proxy可以代替zabbix server检索客户端的数据,然后把数据汇报给zabbix server,并且在一定程度上分担了zabbix server的压力.zabbix pr ...
- zabbix proxy分布式监控部署
一.proxy分布式监控介绍 来源于zabbix官网: https://www.zabbix.com/documentation/3.4/zh/manual/distributed_monitorin ...
- nagios监控部署
nagios监控部署. 在部署之前把依赖包安装了. [root@tiandong63 ~]# yum install -y gcc glibc glibc-common php gd gd-devel ...
- 017-zabbix_proxy分布式监控部署
一.proxy分布式监控介绍 来源于zabbix官网: https://www.zabbix.com/documentation/3.4/zh/manual/distributed_monitorin ...
- Cacti+nagios 整合监控部署文档
目录 Cacti+nagios监控部署步骤... 2 一.Cacti安装... 2 1需要安装的依赖软件包:... 2 2安装rrdtool 2 3启动数据库和httpd服务... 3 4将serve ...
- OneAPM 云监控部署与试用体验
作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的.一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代.但是,随着 APM 市场的火爆,我决定「放下身段」 ...
- Nagios监控部署(转)
转自 http://kyhack.blog.51cto.com/490370/213355 ky.blog 一.nagios简介 nagios是一款用于系统和网络监控的应用程序,它可以在 ...
- linux服务器性能(网卡流量、CPU、内存、磁盘使用率)监控
广义的网站的监控涵盖所有的非业务行为的数据采集与管理,包括数据分析师和产品设计师使用的网站用户行为日志.业务运行数据,以及供运维工程师和开发工程师使用的性能统计数据等. 本文主要是通过shell脚本来 ...
随机推荐
- Python开发【第一篇】基础题目一
1.求1-2+3-4+5.....99的所有数的和 n = 1 s = 0 while n<100: temp = n%2 if temp == 0: #偶数 s = s-n else: s = ...
- Spark1.6之后为何使用Netty通信框架替代Akka
解决方案: 一直以来,基于Akka实现的RPC通信框架是Spark引以为豪的主要特性,也是与Hadoop等分布式计算框架对比过程中一大亮点. 但是时代和技术都在演化,从Spark1.3.1版本开始,为 ...
- zabbix proxy部署
一.概述 环境: 因为公司需要监控远程客户机,但server端无法主动连接agent端,客户端可以连接公司ip 公司有固定ip,可以开放某个端口给zabbixserver,客户机agent端可以主动通 ...
- @EnableWebMvc,WebMvcConfigurationSupport,WebMvcConfigurer和WebMvcConfigurationAdapter区别
@EnableWebMvc是什么 直接看源码,@EnableWebMvc实际上引入一个DelegatingWebMvcConfiguration. @Retention(RetentionPolicy ...
- html基础和CSS选择器
一.html简单基础 什么是HTML HTML 是用来描述网页的一种语言. HTML 指的是超文本标记语言: HyperText Markup Language HTML 不是一种编程语言,而是一种标 ...
- python使用http、https代理
在国内利用Python从Internet上爬取数据时,有些网站或API接口被限速或屏蔽,这时使用代理可以加速爬取过程,减少请求失败,Python程序使用代理的方法主要有以下几种: (1)如果是在代码中 ...
- CI/CD持续集成/持续部署 敏捷开发
敏捷软件开发(英语:Agile software development),又称敏捷开发,是一种从1990年代开始逐渐引起广泛关注的一些新型软件开发方法,是一种应对快速变化的需求的一种软件开发能力.它 ...
- PS快速祛除脸上小雀斑
首先我们要把图片放到PS软件中,然后在PS左侧工具栏中找到污点修复画笔工具(J), 配合着污点修复画笔中的修补工具一起使用,注意:模式要选择正常,属性栏中类型要选择内容识别. 下一步我们需要在图层上添 ...
- python基础概念(转)
基础回顾: 1.集合 集合有2个重要作用:关系测试(并集,差集,交集)和去重. 2.文件编码 2.7上默认文件编码是ASCII码,因为不支持中文,就出了GB2312,在2.7上要支持中文就必须申明文件 ...
- java 反射的基本操作
一.反射的概述JAVA反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意一个方法和属性:这种动态获取的信息以及动态调用对象的方法的功能称为j ...