阿里云k8s事件监控】的更多相关文章

事件监控是Kubernetes中的另一种监控方式,可以弥补资源监控在实时性.准确性和场景上的缺欠.Kubernetes的架构设计是基于状态机的,不同的状态之间进行转换则会生成相应的事件,正常的状态之间转换会生成Normal等级的事件,正常状态与异常状态之间的转换会生成Warning等级的事件.开发者可以通过获取事件,实时诊断集群的异常与问题. 背景信息 kube-eventer是阿里云容器服务维护的开源Kubernetes事件离线工具,可以将集群的事件离线到钉钉.SLS等系统,并提供不同等级的过…
在阿里云Ecs服务器运维过程中,无论是Centos系统还是Windows系统,有时候我们需要监控分析最新的服务器资源利用率等运行情况,例如最近3个小时CPU使用率情况.内存使用率.网络流入带宽.网络流出带宽.服务器TCP连接数等数据状况.上述提到的这些功能,我们可以使用阿里云自带的服务器资源使用监控功能来获取相应的数据,在ECS服务器管理后台可进入监控数据面板页面查看. (1)进入阿里云官网,登陆后进入ECS服务器管理后台,然后在选中需要监控分析的ECS服务器,点击监控数据列的图标即可进入云监控…
问题描述: 阿里云k8s应用日志之前一直都是可以正常的采集, 先出现一问题, 通过kibana 和阿里云的日志服务都没法展示最新的k8s应用的日志, 部分应用的最新日志有被采集到,但大部分应用日志没有做采集到. 通过 命令 curl '17*****0:9200/_cat/indices?v' 查看 部分应用没有建立今天的日志索引 删除了elasticsearch组件, 再重新安装以后, 问题依然存在 通过 kubectl delete DaemonSet log-pilot -n kube-s…
使用Gitlab-CI 实现NetCore项目Docker化并部署到阿里云K8S 先行条件: 1.了解NetCore项目基础命令,如dotnet publish   等几个常用命令. 2.了解Docker基础命令 3.了解centos基础命令 部署步骤: 大致会分为如下几个步骤,后面会详细解析 1.安装 Runner 2.注册 Runner 3.安装Docker环境 4.编写Dockerfile 脚本 5.编写 .gitlab-ci.yml 脚本 6.Push 代码 步骤分解: 1.安装 Run…
有关Spring Cloud Kubernates(以下简称SCK)详见https://github.com/spring-cloud/spring-cloud-kubernetes,在本文中我们主要测试三个功能: 使用Kubernates服务发现配合Spring Cloud Ribbon做服务调用 读取Kubernates的ConfigMap配置并且支持修改后动态刷新 Spring Boot Actuator对Kubernates Pod信息的感知 编写测试程序 首先,我们来创建pom文件,注…
1. 阿里云k8s创建有状态应用 StatefulSet ,  选择使用模板创建 可以创建自定义模板 apiVersion: apps/v1 kind: StatefulSet metadata: creationTimestamp: '2019-09-09T08:45:12Z' generation: 1 labels: app: zookeeper chart: zookeeper-0.4.2 heritage: Tiller release: zk-test02 name: zk-test…
摘要: 应用实时监控服务 (ARMS) 是一款APM类的监控产品. 用户可基于 ARMS 的前端.应用.自定义监控,快速构建实时的应用性能和业务监控能力.ARMS 让所有性能问题“一屏了然”,不遗余力提升每一秒用户体验,驱动业务快速发展. 视频地址:https://yunqivedio.alicdn.com/user-upload/hDtX5zfw7Z.mp4 查看产品:应用实时监控服务 ARMS点击了解:“阿里云新品发布会频道”点击订阅:阿里云新品发布·周刊 阿里云应用实时监控 ARMS是什么…
1. 创建阿里云K8S集群,本文以标准托管集群为例 1.1 创建一个 2台 centos 2core 4G的 k8s 集群 1.2 创建成功的模样 2. 创建 asp.net core webapi项目 3. 发布代码到阿里docker 仓库 3.1 开通阿里云容器镜像服务 3.2 创建镜像仓库 3.3 创建命名空间 3.4 查看仓库信息,点击管理 如下图 3.5 本地执行,拉取 docker hub 的 dotnet core images ,记得 scientific 上网.配置 docke…
#!/bin/bash while [ 1 ] do job_error_no=`kubectl get pod -n weifeng |grep -i "job"|grep -ci error` if [ $job_error_no -gt 0 ];then ps -fe|grep k8s_job_status_monitor|grep -v grep|awk '{print $2}'|xargs kill -9 echo "k8s job running is not s…
前言 监控是保障系统稳定性的重要组成部分,在Kubernetes开源生态中,资源类的监控工具与组件百花齐放.除了社区自己孵化的metrics-server,还有从CNCF毕业的Prometheus等等,开发者可选的方案有很多.但是,只有资源类的监控是远远不够的,因为资源监控存在如下两个主要的缺欠: 监控的实时性与准确性不足 大部分资源监控都是基于推或者拉的模式进行数据离线,因此通常数据是每隔一段时间采集一次,如果在时间间隔内出现一些毛刺或者异常,而在下一个采集点到达时恢复,大部分的采集系统会吞掉…
阿里云的RDS自带的监控系统获取数据不怎么直观,想要通过API获取数据通过zabbix显示,因为网上资料缺乏和其他一些原因,获取API签名很困难,但使用阿里云的SDK可以完美避开获取签名的步骤. 阿里云SDK是什么? SDK是阿里云为用户提供的开发工具,支持JAVA.PHP.C#等几种不同的语言,这里我是用Python写的.在Python SDK里提供了一些模块,我们通过调用这些模块.传入一些必要的参数可以简单的实现数据的获取. 下载地址:https://github.com/aliyun/al…
#!/bin/bash while [ 1 ] do rtt=`ping -c 3 15.0.160.18 |grep rtt |awk '{print $4}' |awk -F'/' '{print $2}'` rtt=${rtt:-'0'} echo $rtt >> /tmp/jianhang_tunnel_monitor.log if [ $rtt -eq 0 ];then ps -fe|grep tunnel|grep -v grep|awk '{print $2}'|xargs ki…
阿里云的RDS自带的监控系统获取数据不怎么直观,想要通过API获取数据通过zabbix显示,因为网上资料缺乏和其他一些原因,获取API签名很困难,但使用阿里云的SDK可以完美避开获取签名的步骤. 阿里云SDK是什么? SDK是阿里云为用户提供的开发工具,支持JAVA.PHP.C#等几种不同的语言,这里是用Python写的.在Python SDK里提供了一些模块,我们通过调用这些模块.传入一些必要的参数可以简单的实现数据的获取. 阿里云的sdk就是很多的库文件,这里我们只需要两个库文件,一个核心库…
1. 登录阿里云Docker Registry $ sudo docker login --username=*****技 registry.cn-hangzhou.aliyuncs.com 用于登录的用户名为阿里云账号全名,密码为开通服务时设置的密码. 您可以在产品控制台首页修改登录密码. 2. 从Registry中拉取镜像 $ sudo docker pull registry.cn-hangzhou.aliyuncs.com/zhiyitech/test:[镜像版本号] 3. 将镜像推送到…
背景 随着小步快跑.快速迭代的开发模式被越来越多的互联网企业认同和采用,应用的变更.升级频率变得越来越频繁.为了应对不同的升级需求,保证升级过程平稳顺利地进行,诞生了一系列的部署发布模式. 停机发布 - 把老版的应用实例完全停止,再发布新的版本.这种发布模式主要为了解决新老版本互不兼容.无法共存的问题,缺点是一段时间内服务完全不可用. 蓝绿发布 - 在线上同时部署相同数量的新老版本应用实例.待新版本测试通过后,将流量一次性地切到新的服务实例上来.这种发布模式解决了停机发布中存在的服务完全不可用问…
jenkins 服务器需先保留着原先构建的不同版本的应用镜像 [root@jenkins sh]# docker images|grep "maintain" registry-vpc.cn-hangzhou.aliyuncs.com/******-ui-maintain 20190719 849ed46fa462 31 minutes ago 293 MB registry-vpc.cn-hangzhou.aliyuncs.com/*******-ui-maintain latest…
jenkins 构建配置参数化构建过程 构建  执行 shell  , 将版本号参数传入 脚本 脚本push  带版本号的镜像到阿里云镜像仓库 #!/bin/bash #获取参数 while getopts "n:" opt; do case $opt in n) version=$OPTARG ;; \?) ;; esac done ****** ****** sudo docker tag fashion*****prod registry-vpc.cn-hangzhou.aliy…
解决步骤: 1. 利用kubectl 修改 k8s 配置, 设置 external** = Local 2. 在服务发现与负载均衡界面,选择对应的LB 服务, 设置服务LB 的 external** = Local…
#!/bin/bash source /etc/profile cd /mnt/workspace/weifeng-ui-pre/ npm i && npm run build rm -rf /mnt/workspace/weifeng-ui-pre/dockerfile/build cd /mnt/workspace/weifeng-ui-pre/dockerfile mv ../build . sudo docker build -t pre-weifeng-ui -f Dockerf…
开发部署pod的时候在wayne平台上部署不上去,删除也删除不了 先删除 kubectl delete pod pod-name --grace-period=0 --force 删除之后然后部署新的pod一直的状态在ContainerCreating 看日志kubectl describe pod 也是显示正常 看集群node状态kubectl get node,一会Noready一会ready 看kubectl日志 journalctl -xu kubelet提示都有报PLEG is not…
名词解释:设备的功能模型之一,设备运行时的事件,事件一般包含需要被外部感知和处理的通知信息,可包含多个输出参数.如,某项任务完成的信息,或者设备发生故障或告警时的温度等,事件可以被订阅和推送. 在工控领域,通信的实时性非常重要,所以有所谓的工业以太网(时间敏感网络TSN).5G之所以成为未来物联网的基石,也是因为时延非常低(毫秒级),才能使无人驾驶落地成为可能. 不过在一些典型的物联网领域,其上传数据的频率却没有那么快,比如环境的温湿度,一般都是分钟级别上传.这就带来一个问题,如果上传的间隔比较…
云K8S相关 AWS 部分-ECR(ERS) ECS EKS 20180824 Chenxin AWS的容器编排目前分为 ECS 和 EKS 两种. AWS价格说明 Fargate模式的ECS,换算成EC2性能的话,价格大约相差了5倍. Fargate的优势是省去了管理EC2的麻烦,以及编排带来的额外风险. AWS ECS实验内容(不推荐)以及容器库ECR Fargate模式(价格贵)(不推荐) 创建流程说明: 集群default -> 服务custom-service(负载均衡,同时还可以配置…
由于业务的关系我们用的是阿里云的ECS主机,需要对业务进程需要监控,查看后发现阿里云提供自定义监控SDK,这有助于我们定制化的根据自身业务来做监控,下面我就根据业务需求来介绍一个简单的自定义监控配置 PYTHON脚本下载地址:http://imgs-storage.cdn.aliyuncs.com/help/jiankong/cms_post.sh?spm=5176.7738831.2.2.bELgkj&file=cms_post.sh shell脚本下载地址:http://imgs-stora…
目前Docker的使用越来越离不开对容器的监控,阿里云最近上线了容器服务,不但提供了核心的容器和宿主机监控能力,而且支持集成 Cloud Insight 监控,下面会介绍如何集成. 首先介绍一下阿里云的容器监控.阿里云容器服务在用户创建集群的时候就默认开启了几个容器服务,其中就包括一个容器监控服务,其监控大概就是使用这个服务来采集数据的. 容器监控的对象就是各个正在跑的容器本身的运行状况,而如果你想要监控在容器里面运行的服务的状况呢?这时候Cloud Insight 就可以帮到你了. 那么我们先…
阿里云提供自定义监控SDK,这有助于我们定制化的根据自身业务来做监控,下面我就根据业务需求来介绍一个简单的自定义监控配置. 阿里提供了2个版本的自定义监控接口:自定义监控SDK(python版) :cms_post.py自定义监控SDK(bash版) :cms_post.sh下载地址:http://help.aliyun.com/knowledge_detail.htm?knowledgeId=5974901 本文使用shell版本做演示       这里说下我的简单需求,我们需要监控ECS服务…
配置jenkins和gitlab: 1.进入jenkins,新增一个项目,demo-piepeline,创建好,点击配置, 2 .设置镜像地址的命名空间: 3.设置镜像的名字 4.设置代码的分支或者tag: 5.设置git地址和刚才的jenkins账号(git里面的新增的账号) 6.设置自动构建镜像和推送代码: 红圈里的是应用的重新发布的地址触发器:这个地址可以在阿里云k8s应用里找到,如图: 7 以上配置好,点击保存,就可以在jenkins进行自动发布了: 8查看发布流程日志 9.发布成功:打…
前言 关于aliyun托管k8s的存储插件主要有两种: CSI # kubectl get pod -n kube-system | grep csi-plugin csi-plugin-8bbnw 9/9 Running 0 26h csi-plugin-fszg9 9/9 Running 0 26h flexvolume # kubectl get pod -n kube-system | grep flexvolume flexvolume-5fw55 1/1 Running 4 288d…
Blog:博客园 个人 由于近期压测,需要频繁登录阿里云查看RDS监控,每次登录查看监控步骤较为繁琐,故将监控接入到zabbix. 概述 由于阿里云已做了RDS的监控,我们只需要通过阿里云SDK把这些监控数据传输到zabbix即可. 前提 子账号 使用阿里云SDK需要一个AK,申请方式如下: 打开RAM 访问控制 (aliyun.com),创建子账号,选择Open api调用方式: 得到AccessKey ID和AccessKey Secret; 添加AliyunCloudMonitorRead…
一.背景和现象 初创公司,架构lanmp,web前端和后端分开服务器,业务驱动主要是nginx和apache,nginx主要是处理静态文件和反向代理,前后端.搜索引擎.缓存.队列等附加的服务都是用docker容器部署.因为比较初级,上传文件和采集文件都是直接写在硬盘上,涉及到的目录共享,就在其中一台服务器存储并且nfs共享.我们暂且分为ECS1(apache1).ECS2(apache2).ECS3(nginx).某天网站业务中断,但是没有报错.一直在等待响应,默认响应超时是一分钟,所以很基础高…
(注:由于阿里云SLB管理控制台监控数据不准,实际故障时间是18:07-18:20.) 17:55-18:2018:07-18:20,我们使用的阿里云SLB(负载均衡)中有3台出现突发故障,造成全站无法访问,给您带来了麻烦,请谅解! 目前已经恢复正常,从阿里云那得知的故障原因是——由于杭州地区的SLB所在网络控制系统出现异常导致. 故障感言:如果淘宝在阿里云上,SLB的网络控制系统敢出现异常吗?…