MapReduce Service更换集群外部时钟源,仅需10步
摘要:MapReduce Service 集群使用NTP进行时钟同步。本文简要介绍了MapReduce Service集群NTP机制及NTP的配置方式。
本文分享自华为云社区《MapReduce Service更换集群外部时钟源》,作者:tangyuxiaobao29。
MapReduce Service 集群NTP机制

1、FusionInsight的主OMS节点向NTP外部时钟源同步
2、所有业务节点向OMS主节点同步
基于上述原理可以看出,实际上整个集群都是最终向NTP时钟源同步的,这样做的最大好处是:无论何时,整个集群内的时钟始终都是与主OMS同步的,至少保证了集群内节点时钟同步。如果外部ntp时钟源没任何问题,那么整个集群也是与外部ntp时钟源同步的!
MapReduce Service 配置NTP服务器实现说明
一、安装FusionInsight Manager阶段配置NTP服务器
FusionInsight Manager安装配置文件install.ini中通过ntp_server_ip参数设置外部NTP时钟服务器IP地址。该参数可选。
当不设置该参数,系统默认使用主管理节点作为NTP服务器。安装后主oms节点ntp状态

集群内非主oms节点ntp状态

当设置该参数且存在多个NTP服务器,需要以英文逗号隔开各IP,如192.168.34.185。安装后主oms节点ntp状态

集群内非主oms节点ntp状态不变

二、安装后更换集群NTP服务器
1、操作场景
安装FusionInsight Manager管理系统后,如果未配置NTP服务器或已配置的NTP不再使用,管理员可以为集群重新指定或者更换新的NTP服务器,使集群从新的NTP时钟源同步时间。
2、对系统的影响
更换NTP服务器是高危操作,更换后集群时间可能将会变化。
更换NTP服务器前NTP服务器与集群当前时间偏差大于150s,则需先停止集群,防止数据丢失。停止集群期间服务无法访问。
3、前提条件
已准备新的NTP服务器并获取IP地址,并设置好集群与新NTP服务器的网络。请确保服务器的NTP服务状态正常,否则将导致操作失败。
IPv4组网的集群只支持配置IPv4网络的外部时钟源,IPv6组网的集群只支持配置IPv6网络的外部时钟源。
如果集群使用IPv4模式,外部时钟源只能用IPv4地址;如果集群使用IPv6模式,外部时钟源只能用IPv6地址。
4、操作步骤
1.登录FusionInsight Manager,查看是否存在未清除的告警
•是,请参见“故障管理”修复告警。告警处理完毕后,执行2。
•否,执行2。
2.使用omm用户分别登录主备管理节点。
3.在主管理节点执行以下命令查看管理平面网关。
cat ${BIGDATA_HOME}/om-server/OMS/workspace/conf/oms-config.ini | grep om_gateway
4.在主备管理节点分别执行ping 管理平面网关,检查节点是否与管理平面网关连通
•是,执行5。
•否,请联系网络管理员修复网络故障,处理完毕后,执行5。
5.在主管理节点执行以下命令,检查集群时间与新的NTP服务器时间偏差。单位为秒。
例如,检查与NTP服务器“192.168.34.185”的时间差,执行ntpdate -d 192.168.34.185,界面显示:

其中0.034136表示时间偏差。正数表示NTP服务器时间比集群当前时间快,负数表示NTP服务器时间比集群当前时间慢。
6.检查时间偏差的绝对值是否超过“150S”。
•是,执行7。
•否,时间偏差的绝对值不超过“150”,以omm用户执行9。
7.确认是否可以停止集群。
•是,停止上层业务并停止集群,然后执行8。
•否,任务结束。
8.确认NTP服务器时间是否比集群当前时间慢
•是,NTP服务器时间慢,停止集群界面显示“操作成功”后需等待,间隔大约为5得到的时间偏差,再以omm用户执行10。
•否,NTP服务器时间快,停止集群界面显示“操作成功”后直接以omm用户执行10。
9.在主管理节点执行以下命令,更换NTP服务器,任务结束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185

执行完毕后检查ntp状态

10.在主管理节点执行以下命令,从NTP服务器“192.168.34.185”立即强制同步时间并更换NTP服务器,任务结束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185 --force_sync_time
说明
•NTP服务器IP地址不可以设置为集群内节点IP地址,否则可能会导致节点与主备oms节点业务网络断连。
•当前最多允许配置2个NTP服务器以主备方式提供服务,可以用“,”将不同服务器分开
•如果停止了集群,在更换NTP服务器后需要重新启动集群。
•未执行强制同步时间命令时,大约以200ms/h的速率进行时间同步。
•执行强制同步时间命令后,集群节点大约需要5分钟完成时间同步。
MapReduce Service更换集群外部时钟源,仅需10步的更多相关文章
- kubernetes将集群外部流量引入集群内
一.service:pod是有生命周期的,我们想给客户一个固定的访问端点,在客户端与服务端之间启动一个固定的中间层,依赖于kubernetes的一个附件CoreDns.kubernetes有三类网路地 ...
- 【Azure微服务 Service Fabric 】因证书过期导致Service Fabric集群挂掉(升级无法完成,节点不可用)
问题描述 创建Service Fabric时,证书在整个集群中是非常重要的部分,有着用户身份验证,节点之间通信,SF升级时的身份及授权认证等功能.如果证书过期则会导致节点受到影响集群无法正常工作. 当 ...
- 【Service Fabric】小白入门记录 本地Service Fabric集群安装及设置
本篇内容是自学自记,现在我还不知道Service Fabric究竟是怎么个入门法,反正按照入门教程先进行本地Service Fabric集群的安装,万里路始于足下,要学习总得先把环境装好了才能开始学习 ...
- t-io 集群解决方案以及源码解析
t-io 集群解决方案以及源码解析 0x01 概要说明 本博客是基于老谭t-io showcase中的tio-websocket-showcase 示例来实现集群.看showcase 入门还是挺容易的 ...
- stm32外部时钟源8M换成12M后库函数相应修改总结
前言 在做“自制继电器上位机控制软件”项目的时候,下位机用到USB虚拟串口,将以前写好的USB虚拟串口程序移植到下位机,发现程序计算机无法识别到虚拟串口STMicroelectronics Virtu ...
- Win7下无法提交MapReduce Job到集群环境(转)
一. 对hadoop eclipse plugin认识不足 http://zy19982004.iteye.com/blog/2024467曾经说到我最hadoop eclipse plugin作用的 ...
- Java --本地提交MapReduce作业至集群☞实现 Word Count
还是那句话,看别人写的的总是觉得心累,代码一贴,一打包,扔到Hadoop上跑一遍就完事了????写个测试样例程序(MapReduce中的Hello World)还要这么麻烦!!!?,还本地打Jar包, ...
- hadoop问题锦集(一):mapreduce不能在集群中运行
问题详细: 搭建类hadoop的集群集群环境,查看hadoop dfsadmin -report 也有datanode节点.在master:50070上也有. 然而在eclipse环境上运行mapre ...
- Redis集群生产环境源码安装
安装redis集群 根据各人单位生产环境用户搭建一.安装环境 操作系统:centos7.6 关闭防火墙.关闭selinux redis1:192.168.26.128 redis2:192.1 ...
随机推荐
- PHP 合并2个链表
输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则. <?php class ListNode{ var $val; var $next = NULL; ...
- MYSQL分页 limit 太慢优化
limit分页原理 当我们翻到最后几页时,查询的sql通常是:select * from table where column=xxx order by xxx limit 1000000,20.查询 ...
- struts2 中 form-action action-form 的传参方式
1. struts2 Action获取表单提交数据 主要有三种方式: 1.1 使用ActionContext类 //获取actionContext对象 ActionContext context = ...
- P3480-[POI2009]KAM-Pebbles【阶梯博弈】
正题 题目链接:https://www.luogu.com.cn/problem/P3480 题目大意 \(n\)个石头堆上进行\(\text{Nim}\)游戏,不过需要满足每次操作前后都有\(a_i ...
- 【理解OS】1.保护模式概述
这个系列文章主要目的是为了记录我个人学习保护模式后的总结与一点点的思考.我也是一个学习者,其中由错误在所难免,若各位朋友指出将不胜感激. 1. Intel CPU的运行模式概述 这里我将粗略介绍Int ...
- cron表达式的双重人格:星期和数字到底如何对应?
写在前面 cron在希腊语中是时间的意思,而cron表达式(cron expression)则是遵循特定规则,用于描述定时设置的字符串,常用于执行定时任务.本文总结了不同环境(如平台.库等)下,cro ...
- Bootstrap的模态框无法弹出的问题
今天在使用Bootstrap官网所提供的模态框插件时候发现其中的 可选尺寸模态框 无法弹出 在模态框前使用过其他 Bootstrap的js插件,可以正常使用,说明所需依赖js文件已经正常引用 注意:j ...
- Java集合——List,Set,Map总结笔记
1. 集合 Collection 1.1 Java 集合框架 Java 集合框架位于 java.util 包中.Java 集合框架主要包括两种类型的容器,一种是集合(C ...
- SpringBoot+WebSocket实时监控异常
写在前面 此异常非彼异常,标题所说的异常是业务上的异常. 最近做了一个需求,消防的设备巡检,如果巡检发现异常,通过手机端提交,后台的实时监控页面实时获取到该设备的信息及位置,然后安排员工去处理. 因为 ...
- 题解 [HNOI2007]分裂游戏
题目传送门 题目大意 有趣的取石子游戏即将开始. 有 \(n\) 堆石头,编号为 \(0,1,2,...,n-1\).两个人轮流挑石头. 在每个回合中,每个人选择三堆编号为 \(i,j,k\) 的石头 ...