问题说明:

一个POD里放了百个容器,然后让K8S集群部署上百个POD,得到可运行上万个容器的实验目的。

实验环境:3台DELL裸机服务器,16核+64G,硬盘容量忽略吧,上T了,肯定够。

1.一开始运行5000多个容器的时候(也就50个POD),集群部署后,10几分钟就起来了,感觉还不错。

2.增加压力,把50个POD增加到100个POD,感觉也不会很长时间,都等到下班后又过了半个小时,还是没有起来,集群链接缓慢,使用kubect里面的命令,好久都出不来信息,UI界面显示服务器超时。

心想,完了,起不来了,把服务器撑死了。让其晚上慢慢启动吧,明天早上查看。

当当当,早上来上班了

打开服务器,使用SSH连接 master 节点,挺好,连接挺快,使用kubectl命令获取pods 信息,居然报服务器错误了,基本都是服务器超时的错误。……

然后用ssh连接 node 节点,直接连不上,本地一致在转圈圈,去机房接显示屏连接,直接也没有反应。

这下子坏了,难道要重新装服务器了,键盘鼠标 CPU都给他分配资源了。这不坏了嘛。。

敲重点……还好,master节点很好,可以连接。这一点Kubernetes做的比较好(我三台服务器的配置一样),有Master节点在就不用担心。

解决方案,上网,问大神,给的方法是 用etcd ,进入集群的专用数据库etcd,删除其POD,然后让服务器转起来

又呵呵了,对与我这样的小白,压根都不会ETCD数据库,K8S集群才刚搭建起来玩玩,怎么会那么高深的操作。

这下会不会被炒鱿鱼!!!!!!!!

突然想到了一个绝招 ,用Docker 呀,看看Docker 是否好用,这也是本次实验的杀手锏了。。下面开始着重讲述了

1.连接master节点,然后输入docker images 和docker ps  和docker ps -a 命令也就会这三个,下了一跳 ,上万个容器僵死在那里,怪不得服务器起不来,上图

2.先把所有的容器 stop掉 ,或者把你认为想stop掉的容器都可以停掉,看下 面我的操作

docker stop $(docker *) //就是停止掉前缀名字为 k8s_hello-ros-10 的容器

3.把停到的容器 删除掉,容器太多,这一步运行的有点慢(上面的代码和这次代码做了一个合并)

docker stop $(docker *) & docker *)

4.处理完之后,迅速回到Master节点的kubectl命令下,此时K8S集群有反应了,先把你的创建的pod时用的yaml 文件删除,输入命令

kubuetc delete -f XXX.yaml

5. 删除你的部署名,因为我是创建POD时,使用Deployments 部署的,所以删除部署,省的根据副本控制器自己又创建POD,那又陷入死循环了

. kubeclt get deployments - kubectl delete deployemtns XXX -n XXX命名空间

6.准备关机重启吧

先关闭NODE节点机,再关闭MASTER机器,重启看看吧

顺利成功,K8S集群启动后,原先的POD已全部删除,剩下了系统要用的POD,集群正常运转。

一次危机就这么化解了……

然后又部署了5000个容器,不敢玩大了,下面图

k8s集群启动了上万个容器(一个pod里放上百个容器,起百个pod就模拟出上万个容器)服务器超时,无法操作的解决办法的更多相关文章

  1. k8s集群上线web静态网站

    环境准备 一台部署节点,一台master节点,还有两台节点node1,node2 完好的k8s集群环境 思路1: 在node1和node2节点上通过宿主机与容器之间目录映射和端口映射上线静态网站(或动 ...

  2. 使用kind快速搭建本地k8s集群

    Kind是什么? k8s集群的组成比较复杂,如果纯手工部署的话易出错且时间成本高.而本文介绍的Kind工具,能够快速的建立起可用的k8s集群,降低初学者的学习门槛. Kind是Kubernetes I ...

  3. Hadoop的HA集群启动和停止流程

    假设我们有3台虚拟机,主机名分别是hadoop01.hadoop02和hadoop03. 这3台虚拟机的Hadoop的HA集群部署计划如下: 3台虚拟机的Hadoop的HA集群部署计划 hadoop0 ...

  4. Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列之自签TLS证书及Etcd集群部署(二)

    0.前言 整体架构目录:ASP.NET Core分布式项目实战-目录 k8s架构目录:Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列目录 一.服务器设置 1.把每一 ...

  5. Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列之flanneld网络介绍及部署(三)

    0.前言 整体架构目录:ASP.NET Core分布式项目实战-目录 k8s架构目录:Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列目录 一.flanneld介绍 ...

  6. Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列之部署master/node节点组件(四)

    0.前言 整体架构目录:ASP.NET Core分布式项目实战-目录 k8s架构目录:Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列目录 1.部署master组件 ...

  7. k8s集群应用例如jenkins启动问题排查思路

    k8s集群应用例如jenkins启动问题排查思路 待办 rancher上的事件报告>pods日志>pods内容器日志(现获取容器id再查看容器日志,获取容器id 使用的是相应问题pod的名 ...

  8. 利用容器逃逸实现远程登录k8s集群节点

    某天, 某鱼说要吃瞄, 于是...... 李国宝:边缘计算k8s集群SuperEdge初体验 ​ zhuanlan.zhihu.com 图标 照着上一篇文章来说,我这边边缘计算集群有一堆节点. 每个节 ...

  9. k8s集群Job Pod 容器可能因为多种原因失效,想要更加稳定的使用Job负载,有哪些需要注意的地方?

    k8s集群Job Pod 容器可能因为多种原因失效,想要更加稳定的使用Job负载,有哪些需要注意的地方? 面试官:"计数性Job默认完成模式是什么?Indexed模式如何发布自定义索引呢?& ...

随机推荐

  1. BZOJ 1602: [Usaco2008 Oct]牧场行走 倍增裸题

    Description N头牛(2<=n<=1000)别人被标记为1到n,在同样被标记1到n的n块土地上吃草,第i头牛在第i块牧场吃草. 这n块土地被n-1条边连接. 奶牛可以在边上行走, ...

  2. 2104 -- K-th Number

    Description You are working for Macrohard company in data structures department. After failing your ...

  3. Python编码显示中文乱码

    爬虫时出现问题: import requests data=requests.get('http://roll.news.sina.com.cn/')print(data.text) 输出结果中文显示 ...

  4. Javascript中的null和 undefined

    Javascript Undefined vs NULL Many a times we often get confused on whats the difference between UNDE ...

  5. call和apply的使用

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...

  6. JavaScript:进制转换。

    最近做了一些进制的转换的点. 十进制转二进制: let a = 45; a.toString(2); //"101101" let b = 123; b.toString(2); ...

  7. Project Euler 42 Coded triangle numbers

    题意:三角形数序列的第n项由公式tn = 1/2n(n+1)给出:因此前十个三角形数是: 1, 3, 6, 10, 15, 21, 28, 36, 45, 55, - 将一个单词的每个字母分别转化为其 ...

  8. 使用 Laravel 5.5+ 更好的来实现 404 响应

    译文首发于 使用 Laravel 5.5+ 更好的来实现 404 响应,转载请注明出处! Laravel 5.5.10 封装了两个有用的路由器方法,可以帮助我们为用户提供更好的 404 页面.现在,当 ...

  9. Acdream A - Unique Attack

    A - Unique Attack Time Limit: 6000/3000MS (Java/Others) Memory Limit: 128000/64000KB (Java/Others)   ...

  10. 数据库连接池dataesoruce pool深入理解

    8.数据库连接池的connection都是长连接的,以方便多次调用,多人连续使用.dataSourcePool9.数据库连接池中的连接,是在你用完之后,返回给数据库连接池的,并不是close()掉,而 ...