GP DBA基本操作

1、查看队列情况

SELECT * FROM gp_toolkit.gp_resqueue_status;

如果出现了资源占用大于1.1 e+11SQL，则可能存在不合理执行计划的SQL，基本跑不出来，库也会很卡。

2、查看用户归属的队列

select * from gp_toolkit.gp_resq_role ;

3、查看某账号下运行中sql

SELECT * from pg_stat_activity where current_query <> '<IDLE>' and waiting ='f' and usename = 'etl_user';

所有账号都有权限查看。

Query_start字段就是SQL真正启动时间点

4、等待中sql

SELECT * from pg_stat_activity where current_query <> '<IDLE>' and waiting ='t';

5、检查执行时间超长的SQL

执行如下SQL 检查是否有select * from pg_stat_activity where current_query<>'<IDLE>' and query_start < now() - interval '10 mins';

6、终止sql

----终止sql的语句，下语句的数字是procid，可以通过上一页的语句查到:

select pg_cancel_backend(27334);

-----终止sql的同时终止会话。

select pg_terminate_backend(27334);

超级账号才有终止权限，如：super_user账号

一定要在数据库里终止一个SQL或任务，因为在ＢＤＩ界面终止一个外部程序任务事实上ＳＱＬ没有终止，还继续运行。

7、执行计划：explain SQL

执行SQL前用explain SQL 查看执行计划

如果执行计划存在针对很大的表做Broadcast Motion 或Nested Loop步骤则不合理，则尝试以下动作：

执行收集表的统计信息语句：ANALYZE 表名;

一般analyze 一天的分区: ANALYZE 表名_1_prt_data_part_20150305;

“_1_prt_”是数据库分区表名固定段。 “data_part_”是我们自动脚本里生成的分区名前缀。

重新看执行计划，如果合理了，则代表源表缺少统计信息导致执行计划不合理。只有在表的数据量发生大变化时或重来没收集过时需要做一次收集。

8、执行计划：explain SQL

ANALYZE完源表重新看执行计划，如果还不合理，执行一下set optimizer to on；更换一个执行计划生成器。

重新生成执行计划。如果合理了，则后续在在ＳＱＬ前加上：set optimizer to on；不要所有SQL加这个，因为该特性未发布。

如果还不合理，则需要优化SQL，即把ＳＱＬ由多张表关联拆开。

9、后台运行SQL，免输入密码

nohup psql -h 10.154.147.130 -d 'dbname=gpadmin user=etl_user password=etl_pppp' -f /home/bdiunivers/aa.sql -L /home/bdiunivers/aa.log &

用psql 命令跑aa.sql文件，如果文件里有多个SQL，想一个SQL报错后不往下跑，则在aa.sql 文件的第一行加上下面内容，行末没有分号 \set ON_ERROR_STOP

10、报内存不足

sql可用内存不够大时，可以用以下方法临时加大。如选择的表分区数很多可能会报内存不足，可以使用该方法。例如：

SET statement_mem='500MB';

SELECT * FROM my_big_table WHERE column='value' ORDER BY id limit 10;

RESET statement_mem;

11、left join 右表非常庞大

如果以后业务场景中确实存在left join 右表非常庞大，并且关联字段重复值比较高，可以采取以下方式：

1，按照关联字段进行数据打散

2，在会话级别设置以下参数

set max_statement_mem='8GB'

set statement_mem='4GB'

set gp_workfile_per_query=0

12、使用super_user创建外部表的过程：

a. 删除并重建err表。

drop table if exists masadw .err_ext_表名;

CREATE TABLE masadw.err_ext_表名 ( cmdtime timestamp with time zone, relname text, filename text, linenum integer, bytenum integer, errmsg text, rawdata text, rawbytes bytea) DISTRIBUTED RANDOMLY;

b.把err表修改owner为etl_user

ALTER TABLE masadw.err_ext_表名 OWNER TO etl_user;

c. 创建外部表：

drop EXTERNAL TABLE if exists masadw.ext_表名;

CREATE EXTERNAL TABLE masadw.ext_表名 ( time_id integer, area_id integer, grp_code character varying(50), cust_id bigint, usr_id bigint, svc_code character varying(50)) LOCATION ( 'gphdfs://hacluster/tmp/zht/NEW_表名.TXT') FORMAT 'text' (delimiter E'' null E'' escape E'OFF')ENCODING 'UTF8'LOG ERRORS INTO masadw.err_ext_表名 SEGMENT REJECT LIMIT 10 PERCENT;

d.把外部表修改owner为etl_user:

ALTER EXTERNAL TABLE masadw.ext_表名 OWNER TO etl_user;

13、不要创建default分区

不要创建default分区，更不要把大量数据放到default分区，因为default分区在每个sql都会扫描。

14、找出需要做vacuum的表

select * from gp_toolkit.gp_bloat_diag ;

这些表需要做空间回收操作

一般vacumm 和analyze一起执行: vacuum analyze 表名

15、找出没有统计信息需要做ANALYZE的表

select 'ANALYZE '||smischema||'.'||smitable||';' from gp_toolkit.gp_stats_missing where smisize = 'f' and smitable like '%_1_prt_%' and smitable not like 'err_%' and smitable not like 'ext_%' and smitable like '%201503%' order by smitable limit 10;

所有存储过程在最后增加GPDB. analyze_partition(表名, 日期)收集一个分区表信息。

16、经常检查数据库状态 gpstate -e

17、经常用nmon命令检查seg节点资源占用率

18、经常检查各机器/data目录 gpssh -f allhosts

19、经常检查各模式下表数量，总共不要超过10万

select schemaname,count(*) from gp_tables group by schemaname order by 2 desc

GP DBA基本操作的更多相关文章

基于USB网卡适配器劫持DHCP Server嗅探Windows NTLM Hash密码
catalogue . DHCP.WPAD工作过程 . python Responder . USB host/client adapter(USB Armory): 包含DHCP Server . ...
MongoDB【第三篇】MongoDB基本操作
MongoDB的基本操作包括文档的创建.删除.和更新文档插入 1.插入 #查看当前都有哪些数据库 > show dbs; local 0.000GB tim 0.000GB #使用 tim数据 ...
Mysql DBA 20天速成教程,DBA大纲
Mysql DBA 20天速成教程基本知识1.mysql的编译安装2.mysql 第3方存储引擎安装配置方法3.mysql 主流存储引擎(MyISAM/innodb/MEMORY)的特点4.字符串编 ...
走向DBA[MSSQL篇] 详解游标
原文:走向DBA[MSSQL篇] 详解游标前篇回顾:上一篇虫子介绍了一些不常用的数据过滤方式,本篇详细介绍下游标. 概念简单点说游标的作用就是存储一个结果集,并根据语法将这个结果集的数据逐条处理. ...
MySQL（一） -- MySQL学习路线、数据库的基础、关系型数据库、关键字说明、SQL、MySQL数据库、MySQL服务器对象、SQL的基本操作、库操作、表操作、数据操作、中文数据问题、校对集问题、web乱码问题
1 MySQL学习路线基础阶段:MySQL数据库的基本操作(增删改查),以及一些高级操作(视图.触发器.函数.存储过程等). 优化阶段:如何提高数据库的效率,如索引,分表等. 部署阶段:如何搭建真实 ...
Django--ORM基本操作
一.字段 AutoField(Field) - int自增列,必须填入参数 primary_key=True BigAutoField(AutoField) - bigint自增列,必须填入参数 pr ...
ORACLE数据库 DBA常用知识
<常用命令参考> 个系统变量值 SQL> show user --显示当前连接用户 SQL> show error --显示错误 SQL> set heading off ...
MYSQL基本操作（上）
很久之前,就想做个Mysql的小结,毕竟数据库知识是软件研发的基本技能,这里话不多说,开始总结一波. 数据库基本概念数据库为高效的存储和处理数据的介质(主要分为磁盘和内存两种),一般关系型数据库存储 ...
linux的基本操作（mysql 的基本操作）
Mysql 的基本操作在前面两个章节中已经介绍过MySQL的安装了,但是光会安装还不够,还需要会一些基本的相关操作.当然了,关于MySQL的内容也是非常多的,只不过对于linux系统管理员来讲,一些 ...

随机推荐

Java类载入器原理分析
一:Java虚拟机中能够安装多个类载入器,系统默认是三个基本的类载入器: Bootstrap ExtClassLoader AppClassLoader 类载入器也是Java类.由于其它Java类 ...
linux c 常常混淆的概念
指针函数 and 函数指针指针函数是指带指针的函数,即本质是一个函数.函数都有返回类型(假设不返回值,则为无值型),仅仅只是指针函数返回类型是某一类型的指针. 定义格式类型名 *函数名(函数參数列 ...
Jmeter BeanShell 引用变量报错jmeter.util.BeanShellInterpreter: Error invoking bsh method: eval Parse error at line 14, column 181 : Error or number too big for integer
如果你通过CSV Data Set Config或者_StringFromFile函数来参数化你的请求,需要特别注意当参数为纯数字时,jmeter会默认将其识别成int型数据,说明jmeter并不是默 ...
生产者——消费者模型的java代码实现
生产者 import java.util.Random; public class Producer extends Thread { private Storage<Product> s ...
unintest基础1
import unittest class Testfunc(unittest.TestCase): def testfunc(self): print('testfunc1') def testfu ...
动软生成的WCP DAO层模板（不使用接口）
本实战是博主初次学习Java,分析WCP源码时,学习HibernateTools部分的实战,由于初次接触,难免错误,仅供参考,希望批评指正. 开发环境: Eclipse Version: Photon ...
CSU-1632 Repeated Substrings[后缀数组求重复出现的子串数目]
评测地址:https://cn.vjudge.net/problem/CSU-1632 Description 求字符串中所有出现至少2次的子串个数 Input 第一行为一整数T(T<=10)表 ...
【BZOJ2044】三维导弹拦截 DP+（有上下界的）网络流
[BZOJ2044]三维导弹拦截 Description 一场战争正在A国与B国之间如火如荼的展开. B国凭借其强大的经济实力开发出了无数的远程攻击导弹,B国的领导人希望,通过这些导弹直接毁灭A国的指 ...
二、docker入门
docker入门使用场景: 面向产品.面向开发.面向测试.面向运维.面向自动化.面向微服务.面向大规模的分布式架构(微信红包) 虚拟化解决方案: 商业解决方案: VMware vSphere,VMw ...
巨蟒django之权限10,内容梳理&&权限组件应用
1.CRM项目内容梳理: 2.权限分配 3.权限组件的应用

GP DBA基本操作

GP DBA基本操作的更多相关文章

随机推荐

热门专题