理解OpenShift(1):网络之 Router 和 Route 理解OpenShift(2):网络之 DNS(域名服务) 理解OpenShift(3):网络之 SDN 理解OpenShift(4):用户及权限管理 理解OpenShift(5):从 Docker Volume 到 OpenShift Persistent Volume 理解OpenShift(6):集中式日志处理 理解OpenShift(7):基于 Prometheus 的集群监控 ** 本文基于 OpenShift 3.11…
理解OpenShift(1):网络之 Router 和 Route 理解OpenShift(2):网络之 DNS(域名服务) 理解OpenShift(3):网络之 SDN 理解OpenShift(4):用户及权限管理 理解OpenShift(5):从 Docker Volume 到 OpenShift Persistent Volume 理解OpenShift(6):集中式日志处理 ** 本文基于 OpenShift 3.11,Kubernetes 1.11 进行测试 *** 1. Docker…
Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架.它启发于 Google 的 borgmon 监控系统,并于 2015 年正式发布.2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目. 7月3日,阿里云Promtheus云托管实例正式开始免费公测.针对容器集群监控场景,提供了完整的采集.存储.监控.告警.图表展现的数据监控服务.通过与 Kuberne…
基于k8s的集群稳定架构-转载 前言 我司的集群时刻处于崩溃的边缘,通过近三个月的掌握,发现我司的集群不稳定的原因有以下几点: 1.发版流程不稳定 2.缺少监控平台[最重要的原因] 3.缺少日志系统 4.极度缺少有关操作文档 5.请求路线不明朗 总的来看,问题的主要原因是缺少可预知的监控平台,总是等问题出现了才知道.次要的原因是服务器作用不明朗和发版流程的不稳定. 解决方案 发版流程不稳定 重构发版流程.业务全面k8s化,构建以kubernetes为核心的ci/cd流程. 发版流程 有关发版流程…
前言 <基于Kubernetes舵手集群的设计与实现>是我的毕业设计项目.本系统采用Kubernetes容器编排.基于Jenkins\Gitlab的CICD技术.EFK日志收集.Prometheus监控告警.Ceph后端存储和Harbor镜像管理,设计并实现了具有"源码一键部署"."日志实时收集"."监控告警展示"."数据存储分析"和"镜像管理维护"五大模块的舵手集群系统. 拓扑图 总体架构图…
基于puppet分布式集群管理公有云多租户的架构浅谈 一.架构介绍   在此架构中,每个租户的业务集群部署一台puppet-master作为自己所在业务集群的puppet的主服务器,在每个业务集群所拥有的云主机上部署puppet-agent,定时向puppet-master进行汇报从而执行相应任务.foreman单独部署,接收每个业务集群中puppet-master收集到的puppet-agent服务器所报告的信息.foreman收集到的数据存至MySQL数据库中,并进行前端展示.其中mysql…
上篇文章介绍了如何使用docker部署Ceph分布式存储集群,本篇在此基础之上,介绍如何基于Ceph分布式存储集群实现docker跨主机共享数据卷. 1.环境准备 在原来的环境基础之上,新增一台centos7虚拟机,用来做Ceph的客户端,如下: hostname ip 备注 node1 192.168.56.111 ceph.rbd客户端 1.1 在111上安装docker(略): 1.2 在111上安装ceph.rbd客户端: 首先,在111上添加ceph源 vim /etc/yum.rep…
从零开始:Mysql基于Amoeba的集群搭建 准备环境 1.mysql-5.7.24-linux-glibc2.12-x86_64.tar.gz 2.amoeba-mysql-binary-2.0.1-BETA.tar.gz 3.Centos7 下载安装配置运行 1.mysql安装 使用wget命令下载安装 //创建目录 mkdir /software/mysql cd /software/mysql wget https://dev.mysql.com/get/downloads/mysql…
一 集群监控 1.1 Metrics Kubernetes的早期版本依靠Heapster来实现完整的性能数据采集和监控功能,Kubernetes从1.8版本开始,性能数据开始以Metrics API的方式提供标准化接口,并且从1.10版本开始将Heapster替换为Metrics Server.在Kubernetes新的监控体系中,Metrics Server用于提供核心指标(Core Metrics),包括Node.Pod的CPU和内存使用指标. 对其他自定义指标(Custom Metrics…
更多精彩内容,请关注微信公众号:后端技术小屋 一文读懂clickhouse集群监控 常言道,兵马未至,粮草先行,在clickhouse上生产环境之前,我们就得制定好相关的监控方案,包括metric采集.报警策略.图形化报表.有了全面有效的监控,我们就仿佛拥有了千里眼顺风耳,对于线上任何风吹草动都能及时感知,在必要的情况下提前介入以避免线上故障. 业界常用的监控方案一般是基于prometheus + grafana生态.本文将介绍由clickhouse-exporter(node-exporter…