出差刚到家,公司最近接了一个矿场转建公有云平台的项目。

前期200台服务器作为公有云基础。

我主要负责总体网络规划、计费数据库集群设计、ceph集群自动部署、容器化设计、硬件及系统调试优化等等!

由于机房刚刚建设并且矿机都是被超过频的,直接做GPU是不行的,需要对显卡bios进行降频。

还有N多硬核问题如:硬盘坏道故障、网络拥堵,docker网桥冲突,并且在实施过程中发现有20台服务器被挖矿病毒污染了。。你敢信嘛?以及各种问题。

后续会陆陆续续更新这些问题的排查及处理方法。

老衲会开源废了九牛二虎之力设计的mysql容器集群方案以及一键部署脚本。

由于近期各种旁系项目太多,devops3.0开发进度又被耽误了。不过现在已经完成了ansible2.4+的接口集成、cmdb功能实现、接下来就是各种批量任务了。

因为有不少纯开发的同学,可能都没见过IDC机房长啥样,今天就带大家进IDC机房看看吧!

设备都是国产的1U服务器。

冷风通道,门口一个推拉门,进去后照明自动亮起。还是有点科技感觉的

当时三个服务器有问题,我就在这里调试了一下午。。相关案例细节我会在后续讲。

机柜门配有橘色氛围灯,极其暧昧:

机架式国产1U服务器

存储及其他设备

机房都是上走线了。8年前还都是下走线,下面搭个铁架龙骨,要是线有问题就得把地板块拆了,再下去顺着标签找线。唉想想都是眼泪!

当年做实施的时候拼的就是绑线的手艺。经常以为漏了几根线,全拆了重新绑。现在已经不行啦。但是看这帮小伙帮的还是不错的。

机房着火咋办?看到了,专业的灭火设备

 
 
核心机房的电源一般都是双路电,然后接UPS,并且还配备有备用发电机。
 

空调是两台互备,当年出现过空调室外机过滤网被柳絮堵了导致空调宕机,机房温度半小时内升至50多度,门把手都烫手无法进入抢修的情况。

唉!~想当年。。算了不说了。

上面只是机房一个小角落!大概就是这个样子的。

这些天熬得太厉害了,确实累了,明天整理资料和案例再给大家分享哦!

感谢各位的关注,我会持续给各位带来各个维度的技术干货。IT不易,各位互勉吧!
欢迎关注我的个人公众号,有更多的学习资料等您来拿。

公有云大脑——核心IDC简影的更多相关文章

  1. [转帖]IDC发布2018下半年中国公有云市场报告

    IDC发布2018下半年中国公有云市场报告:AWS以6.4%的份额名列第四 http://www.itpub.net/2019/05/06/1793/ 电信的公有云 好像是用的 华为的技术. AWS在 ...

  2. 公有云开启全面竞争时代——青云QingCloud

    网界网本期[封面报道]公有云开启全面竞争时代 [CNW.com.cn 专稿] 险滩急流之后,公有云[注]服务市场的开拓者们终于看到了一片丰饶之海. 2013年,中国云计算[注]产业起步的第五年,公有云 ...

  3. 公有云厂商DDoS防护产品竞品分析——内含CC的一些简单分析,貌似多是基于规则,CC策略细粒度ip/url//ua/refer

    公有云厂商DDoS防护产品竞品分析 from:http://www.freebuf.com/articles/network/132239.html 行文初衷 由于工作关系,最近接触了很多云上用户,对 ...

  4. 西瓜哥:公有云也“All-Flash”?

    本文转载自 高端存储知识 Gartner在2018年Market Insight: Preparing for the SSD Rise and HDD Demise一文中指出:当闪存介质降到HDD每 ...

  5. Azure China (1) Azure公有云落地中国

    <Windows Azure Platform 系列文章目录> 微软公有云Microsoft Azure已经落地中国,官方网址:http://www.windowsazure.cn/. 在 ...

  6. Windows Azure公有云服务相关方案

    http://www.cnblogs.com/sennly/p/4139675.html 1.公有云平台服务简介 Windows Azure 是一个灵活而开放的云平台,通过该平台,您可以在数据中心快速 ...

  7. [转帖]中国公有云2018H1市场占有率

    IDC:阿里云中国第一 市场份额为2到9名总和   https://news.cnblogs.com/n/617838/ 1 月 21 日,市场研究机构 IDC 日前公布 2018 年上半年中国公有云 ...

  8. (转)公有云vr客户端tcp连接数太多造成 系统卡顿问题 [bittorrent tracker优化] -公有云常见网络问题及思路

    在公有云服务器 发现使用tcp(http)的tracker连接数太多 用户太多会造成windows系统卡顿 特此发表一下修改配置和路由器的方法 解决卡顿问题 解决方法1(参考内容): 修改 /etc/ ...

  9. 微软Azure公有云个人用户是否能支付得起?

    个人建立自己的站点是普通"白领"的愿望.由于,我们的大脑分泌的脑汁须要排泄渠道.怎么办呢? 依据微软公有云的公开报价(Pricing),租用单核CPU.0.75GB内存,20GB硬 ...

随机推荐

  1. 如何查看一个Application是32位的还是64位的?

    使用process explorer查看,找到对应的进程. 注册表的路径是Computer\HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\ 使用powershell查 ...

  2. Web.xml配置----字符过滤器

    添加EncodingFilter类实现Filter接口 import javax.servlet.*;import javax.servlet.http.HttpServletRequest;impo ...

  3. 识别String类型变量的问题

    碰到了android无法识别string的问题 Cursor cursor = db.query(true, "user", new String[]{"id" ...

  4. LRU原理和Redis实现——一个今日头条的面试题

    看了评论,发现有些地方有问题,更新了图和一些描述,希望可以更清晰一些,也欢迎关注,还会有干货文章 -------- 很久前参加过今日头条的面试,遇到一个题,目前半部分是如何实现 LRU,后半部分是 R ...

  5. String、StringBuffer和StringBuilder有什么区别?

    1. String 类 String的值是不可变的,这就导致每次对String的操作都会生成新的String对象,不仅效率低下,而且大量浪费有限的内存空间.String a = "a&quo ...

  6. (水题)洛谷 - P1996 - 约瑟夫问题 - 链表

    https://www.luogu.org/problemnew/show/P1996 试了一下数组实现的双向链表,是挺难用的,估计是应该写个get_next()函数比直接用next数组好. #inc ...

  7. POJ3250【单调栈】

    思路: 维护一个单调递增的栈,对于栈顶元素<=新值来说,那么后面的,我一定看不到了,pop掉以后,那么这时候的栈的大小就是我能看到的这个刚刚pop出去元素的个数. //#include < ...

  8. Codeforces626C 【二分】

    题意: 有两种搬砖的(不好好打代码就只能搬砖了),有n个sou弱的只能搬2块,m个stronger一点的能搬3块,他们想作死的独自把砖垒高,然后每个人垒的高度还各不相同,问你存在的最高高度的最小: 思 ...

  9. POJ1050【DP】

    题意: 求一个最大子矩阵和. 思路: 枚举行区间,然后求一个最大子序列和. 贴一发挫code- #include <iostream> #include <cstdio> #i ...

  10. loj#2541. 「PKUWC2018」猎人杀

    传送门 思路太清奇了-- 考虑容斥,即枚举至少有哪几个是在\(1\)号之后被杀的.设\(A=\sum_{i=1}^nw_i\),\(S\)为那几个在\(1\)号之后被杀的人的\(w\)之和.关于杀了人 ...