一 简介:简述DBA相关管理MGR工作

二 监控

1 采用proxysql相关创造的view视图作为监控指标

三 备份

1 利用xtrabackup在读节点进行备份

2 设置binlog保留日期

四  DDL操作

1 索引相关可以直接DDL操作

2 大表相关采用PT-OSC在业务低峰期操作,MGR每个节点会执行相同的动作,所以要在业务低峰期做

五  数据恢复工具

1 采用美团恢复工具可以恢复数据,经过测试完全没问题

六 中间件选择

1 proxysql+mgr 会有性能损耗,但是能实现读写分离

2 自定义程序自住进行判断

3 采用HAPROXY+PXC方案,守护进程脚本需要自定义

七 常见错误锦集

1  Plugin group_replication reported: 'Error on session 16608. Transaction of size 24800282 exceeds specified limit 20971520. To increase the limit please adjust group_replication_transaction_size_limit option.'

分析 这是由于限制了大事务的大小,建议对事务进行拆分

2  集群发生网络故障,导致从节点被踢出,重新加入后导致数据不一致

分析 此问题见于爱可生的一篇文章,进行模拟,mysql官方也有BUG描述.大概率由于网络阻塞引起.同一GTID下的主和从不同事务内容,导致数据不一致,原来的事务丢失

解决方法: mysql5.7.26应该已经解决此BUG,对于存在BUG的版本可以进行故障节点重做,避免不一致情况发生

3 Connection attempt from IP address refused. Address is not in the IP whitelist.'

解决方法 节点的IP段没在MGR的白名单上,进行IP地址段的添加即可

4 Plugin group_replication reported: 'Can't start group replication on secondary member with single primary-mode while asynchronous replication channels are running.'

分析 如果节点曾经做过从库,那么在开启组复制的时候会报错,且日志中会出现以下错误 执行reset master reset slave

5  Slave I/O for channel 'group_replication_recovery': error connecting to master 'repl@bztcloud-mysql1:3306' - retry-time: 60  retries: 1, Error_code: MY-002061

分析 恢复通道无法连接 可能有三种情况

1 账号本身有问题,用账号也无法链接 在mysql8.0环境下会出现这个问题,由于验证机制已经改变

2 集群网络有问题,造成无法连接的

MGR 架构 ~ DBA相关运维管理的更多相关文章

  1. 15-MySQL DBA笔记-运维管理

    第15章 运维管理 随着各种技术的快速发展,现今的DBA可以比以前的DBA维护多得多的数据库实例.DBA已经越来越像一个资源的管理者,而不是简单的操作步骤执行人.本章将为读者介绍规模化运维之道.首先, ...

  2. 企业该如何进行高效IT运维管理

    企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...

  3. 不吹不黑,赞一下应用运维管理的cassacdra

    不吹不黑的为菊厂的应用运维管理AOM点个赞.Why? 某菊厂应用运维管理工具AOM每天处理着亿级条数据,这么多数据是怎么存储的呢? 说到数据存储就会想到关系型数据库,比如mysql,oracle,sy ...

  4. 系统批量运维管理器Fabric详解

    系统批量运维管理器Fabric详解 Fabrici 是基于python现实的SSH命令行工具,简化了SSH的应用程序部署及系统管理任务,它提供了系统基础的操作组件,可以实现本地或远程shell命令,包 ...

  5. 5年从DBA到运维架构总监 — 做对了什么

    本文来自宝宝树运维总监刘秋岐的分享.随着MySQL的不断成熟,逐渐被用于更多大规模的网站和应用了,比如说当前最火的Facebook.淘宝.阿里.兰亭集势.宝宝树这样的大型的网站都在使用MySQL数据库 ...

  6. 14-MySQL DBA笔记-运维技巧和常见问题处理

    第14章 运维技巧和常见问题处理 DBA的成长,离不开对各种问题的处理.本章将为读者介绍一些运维技巧和常见问题的处理方法.我们需要意识到,别人的经验代替不了自己的经验,所以,多实践.多处理问题,最终会 ...

  7. 使用Ansible实现数据中心自动化运维管理

    长久以来,IT 运维在企业内部一直是个耗人耗力的事情.随着虚拟化的大量应用.私有云.容器的不断普及,数据中心内部的压力愈发增加.传统的自动化工具,往往是面向于数据中心特定的一类对象,例如操作系统.虚拟 ...

  8. 浅谈SDN架构下的运维工作

    导读 目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命.运维人员只能埋头查找系统运行的日志,耗时耗力,老眼昏花不说,有时候忙了半天还一无所获,作为运维工程师的你,有木有遇到过类 ...

  9. Redis 相关运维操作

    背景 Redis作为目前全球最流行的KV存储,除了使用之外,还需要做好日常的运维工作.关于运维相关的工作,本文从以下方面进行介绍说明(Redis5.0以上): 内存方面 客户端连接方面 工具方面 说明 ...

随机推荐

  1. latex 导入pdf

    pdflatex \includepdf[addtotoc={1,section,1,something would show in catalog,cc},pages=-,offset=0cm 0. ...

  2. python基础四-文件读取

    文件读取 open()接受一个参数:要打开的文件名, 并返回一个表示文件的对象, 存储到后面的变量中 python会在当前执行文件所在目录查找 可以使用绝对路径, 在linux中使用'/', 在win ...

  3. JS学习笔记Day3

    一.什么是循环结构 满足一定条件,(((重复)))执行一段相同的代码 二.循环思想是什么(循环三要素) 开始 结束 步长(步进) 三.可以实现循环语句的有哪些 while do while for 四 ...

  4. HTML学习笔记Day3

    一.CSS样式 1.每个css样式都必须由两部分组成:选择符(Selector)+声明(Deleration) 注:声明又包括属性(Properyt)和属性值(value) 2.css属性:属性是指定 ...

  5. 信用评分卡 (part 5 of 7)

    python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_camp ...

  6. MySQL数据库优化_limit_1

    转自:https://blog.csdn.net/cbjcry/article/details/70155118 1. MySQL中,在某些情况下,如果明知道查询结果只有一个,SQL语句中使用LIMI ...

  7. 分享两个好用的nosql GUI工具

    redis: 真是千呼万唤始出来,终于有了redis gui 谢谢作者,但中文乱码问题貌似还没有解决呀! https://github.com/caoxinyu/RedisClient mongoDB ...

  8. 一张图教你弄清楚linux虚拟机的静态IP设置原理 VMnet8

  9. Oracle数据库XXE注入漏洞(CVE-2014-6577)分析

    在这篇文中,我们将共同分析一下Oracle数据库的XXE注入漏洞(CVE-2014-6577),Oracle公司1月20日发布了针对该漏洞的相关补丁. 有关XXE的相关知识,可以查看安全脉搏站内的另一 ...

  10. 【C++】reference parameter-引用参数

    1.reference parameter 以下两个函数等效,只调用方式不同: 1> 1 int reset(int i){ 2 i = 13; 3 return i; 4 } 5 6 int ...