postgresql Streaming Replication监控与注意事项
一监控Streaming Replication集群
1 pg_stat_replication视图(主库端执行)
|
pid |
Wal sender process的进程ID |
|
usesysid |
执行流复制的用户的OID |
|
usename |
执行流复制的用户名 |
|
application_name |
连接到master的Application name |
|
client_addr |
standby的ip地址 |
|
client_hostname |
Standby主机名 |
|
client_port |
standby上连接端口 |
|
backend_start |
Wal sender process启动时间。 |
|
state |
WAL sender process状态 |
|
sent_location |
WAL发送位置 |
|
write_location |
Standby端写WAL位置 |
|
flush_location |
Standby端写WAL刷新到磁盘的位置 |
|
replay_location |
Standby端应用WAL位置 |
|
sync_priority |
standby的优先级 |
|
sync_state |
standby的同步类型 |
主库上通过执行函数把WAL位置转换成WAL文件名与偏移量
select * from pg_xlogfile_name_offset('XXX');
查看备库落后主库多少个字节的wal日志
select pg_xlog_location_diff(pg_current_xlog_location(),replay_location) from pg_stat_replication;
2pg_is_in_recovery()查看数据库状态
3pg_controldata查看数据库信息
4hot standby查看备库接收wal日志和应用wal日志的状态信息(standby上执行)
pg_last_xlog_receive_location()//standby最后接收到的事务日志。
pg_last_xlog_replay_location()//standby最后应用到的事务日志位置。
pg_last_xact_replay_timestamp()//recovery过程中最后一个事务执行的时间。
select pg_last_xlog_receive_location(),pg_last_xlog_replay_location(),pg_last_xact_replay_timestamp();
二Streaming Replication集群常见问题
2.1备库查询限制
DML,DDL限制
select * from table for update;
比row exclusivemode级别高的表锁不能执行等。
2.2备库查询冲突与处理
Ø 冲突如下:
1主库上运行的vacuum清理掉了备库上查询还需要的多版本数据。
2主库上执行lock命令或各种DDL语句会在表上产生exclusive锁,而在备库上对这些表进行查询时,就会产生冲突。
3在主库上删除一个表空间,而备库上的查询需要存放的一些工作临时文件在此表空间中。
4主库上删除了一个数据库,而备库上还有还多session还在连接在这个数据库上。
Ø 处理方法:
1备库延迟应用wal日志
参数用于控制应用wal日志最多等多久,超过这个时间,将应用wal日志,取消备库上正在执行的查询(在视图pg_stat_database_conflicts中查询取消执行的sql)。
Max_standby_archive_delay备库从归档中读取的最大延迟,默认是30s,如果设置是-1,则一直等下去。
Max_standby_streaming_delay备库从流复制中读取wal时的最大延迟,默认是30s,如果设置是-1,则一直等下去。
2主库上运行的vacuum清理掉了备库上查询还需要的多版本数据,
解决方法1
在备库上设置参数hot_standby_feedback为true来解决,设置该参数为true后,备库会通知主库,那些多版本的数据在备库上还需要,这样主库上的autovacuum就不会清理掉这些数据,从而减少冲突。
解决方法2.
在主库增大vacuum_defer_cleanup_age值,让数据库延迟清理多版本数据。
在备库recovery.conf中参数recovery_min_apply_delay。
2.3流复制注意事项
1wal_keep_segments:为备库保留多少个日志文件
主库还没有来得及把wal日志传送到备库,可能被覆盖,如果没有被归档,那么日志文件不连续了。
2vacuum_defer_cleanup_age:延迟清理多少个事务
原因:主库清理的数据,有可能备库正在查询使用,会导致查询失败。
3关于主备库archive_mode、archive_command
(1)在主库postgresql.conf配置文件配置如下
archive_mode = on
archive_command = 'cp %p /pgdb/archlog/%f'
主库开启归档模式,事务日志写入.. /data/pg_xlog目录,archive_command把归档日志复制到/ pgdb /archlog
(2)在备库archive_mode、archive_command值对备库没有任何影响,备库不会加载该配置。主库事务提交后,备库接收日志流,写入../data/pg_xlog目录并应用,但不执行archive_command归档命令。
新特性:PostgreSQL9.5.1:archive_mode = always 支持备节点应用日志流后,归档。
postgresql Streaming Replication监控与注意事项的更多相关文章
- 配置PostgreSQL Streaming Replication集群
运行环境: Primary: 192.168.0.11 Standby: 192.168.0.21, 192.168.0.22 OS: CentOS 6.2 PostgreSQL: 9.1.2 版本以 ...
- PostgreSQL Streaming Replication的FATAL ERROR
磨砺技术珠矶,践行数据之道,追求卓越价值回到上一级页面: PostgreSQL集群方案相关索引页 回到顶级页面:PostgreSQL索引页[作者 高健@博客园 luckyjackgao@gm ...
- PostgreSQL 9.3 Streaming Replication 状态监控
postgresql是使用Streaming Replication来实现热备份的,热备份的作用如下: 灾难恢复 高可用性 负载均衡,当你使用Streaming Replication来实现热备份(h ...
- Streaming replication slots in PostgreSQL 9.4
Streaming replication slots are a pending feature in PostgreSQL 9.4, as part of the logical changese ...
- PostgreSQL的streaming replication
磨砺技术珠矶,践行数据之道,追求卓越价值回到上一级页面: PostgreSQL集群方案相关索引页 回到顶级页面:PostgreSQL索引页[作者 高健@博客园 luckyjackgao@gm ...
- PostgreSQL Cascade Replication
PostgreSQL Cascade Replication node1:master:10.2.208.10:repclia(user) node2:upstreamnode:10.2.208.11 ...
- LoadRunner添加Weblogic监控的注意事项(非单纯的操作步骤)
LoadRunner添加Weblogic监控的注意事项(非单纯的操作步骤) 关于LR如何监控Weblogic(JMX方式)的操作就不在这里多说了,帮助文件和网上的介绍已经非常多了,关键是对各操作步 ...
- [笔记] postgresql 流复制(streaming replication)
基本环境说明: os:FreeBSD 9.3 postgresql version: master:192.168.56.101 standby:192.168.56.102 安装过程略,基于pkg包 ...
- postgreSQL数据库的监控及数据维护
目前postgreSQL数据库的管理,数据查询等都需要安装postgreSQL软件或安装pgadmin等,远程访问都需要先登录到服务器等繁琐的操作.如果是开发团队,那么每个开发,测试,管理人员都要经历 ...
随机推荐
- WEB超大文件上传与下载
1.介绍enctype enctype 属性规定发送到服务器之前应该如何对表单数据进行编码. enctype作用是告知服务器请求正文的MIME类型(请求消息头content-type的作用一样) 1. ...
- [USACO08FEB]Hotel 题解
正确的题解 首先我们都知道这题要用线段树做.考虑维护靠左边的answer,靠右边的answer,和整个区间的answer,那么就珂以维护这道题目了. 这里比较复杂的有下传操作和上传操作. 上传 voi ...
- HDU 6581 Vacation
Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others)Total Submission( ...
- EF 查询时,返回其中一张表(省掉一个个写字段的麻烦)
1.使用partial将需要添加的字段进行扩展 public partial class T_OrderInfo { public string EntName { get; set; } } 2.使 ...
- Java 线程状态有哪些?
线程状态有 5 种,新建,就绪,运行,阻塞,死亡.关系图如下: 1. 线程 start 方法执行后,并不表示该线程运行了,而是进入就绪状态,意思是随时准备运行,但是真正何时运行,是由操作系统决定的,代 ...
- 认识了一个新的手机游戏剖析工具- SnapDragon Profiler
原来这个是高通的工具,具说UNITY官方推荐了这个工具.大概看了下,可以从宏观上实时剖析手机应用的方方面面
- 职位-CTO:CTO
ylbtech-职位-CTO:CTO 首席技术官是技术资源的行政管理者,英文为Chief Technical Officer或Chief Technology Officer,简称CTO.其职责是制订 ...
- java 操作hdfs(连接HDFS)
FileSystem fs = null; Configuration conf = null; @Before public void init() throws Exception{ conf = ...
- 【服务器】一次对Close_Wait 状态故障的排查经历
最近接连听说一台线上服务器总是不响应客户端请求. 登录服务器后查询iis状态,发现应用程序池状态变为已停止. 按经验想,重启后应该就ok,第一次遇到也确实起了作用,当时完全没在意,以为是其他人无意把服 ...
- 阶段1 语言基础+高级_1-3-Java语言高级_04-集合_01 Collection集合_6_迭代器的实现原理