出差刚到家,公司最近接了一个矿场转建公有云平台的项目。

前期200台服务器作为公有云基础。

我主要负责总体网络规划、计费数据库集群设计、ceph集群自动部署、容器化设计、硬件及系统调试优化等等!

由于机房刚刚建设并且矿机都是被超过频的,直接做GPU是不行的,需要对显卡bios进行降频。

还有N多硬核问题如:硬盘坏道故障、网络拥堵,docker网桥冲突,并且在实施过程中发现有20台服务器被挖矿病毒污染了。。你敢信嘛?以及各种问题。

后续会陆陆续续更新这些问题的排查及处理方法。

老衲会开源废了九牛二虎之力设计的mysql容器集群方案以及一键部署脚本。

由于近期各种旁系项目太多,devops3.0开发进度又被耽误了。不过现在已经完成了ansible2.4+的接口集成、cmdb功能实现、接下来就是各种批量任务了。

因为有不少纯开发的同学,可能都没见过IDC机房长啥样,今天就带大家进IDC机房看看吧!

设备都是国产的1U服务器。

冷风通道,门口一个推拉门,进去后照明自动亮起。还是有点科技感觉的

当时三个服务器有问题,我就在这里调试了一下午。。相关案例细节我会在后续讲。

机柜门配有橘色氛围灯,极其暧昧:

机架式国产1U服务器

存储及其他设备

机房都是上走线了。8年前还都是下走线,下面搭个铁架龙骨,要是线有问题就得把地板块拆了,再下去顺着标签找线。唉想想都是眼泪!

当年做实施的时候拼的就是绑线的手艺。经常以为漏了几根线,全拆了重新绑。现在已经不行啦。但是看这帮小伙帮的还是不错的。

机房着火咋办?看到了,专业的灭火设备

 
 
核心机房的电源一般都是双路电,然后接UPS,并且还配备有备用发电机。
 

空调是两台互备,当年出现过空调室外机过滤网被柳絮堵了导致空调宕机,机房温度半小时内升至50多度,门把手都烫手无法进入抢修的情况。

唉!~想当年。。算了不说了。

上面只是机房一个小角落!大概就是这个样子的。

这些天熬得太厉害了,确实累了,明天整理资料和案例再给大家分享哦!

感谢各位的关注,我会持续给各位带来各个维度的技术干货。IT不易,各位互勉吧!
欢迎关注我的个人公众号,有更多的学习资料等您来拿。

公有云大脑——核心IDC简影的更多相关文章

  1. [转帖]IDC发布2018下半年中国公有云市场报告

    IDC发布2018下半年中国公有云市场报告:AWS以6.4%的份额名列第四 http://www.itpub.net/2019/05/06/1793/ 电信的公有云 好像是用的 华为的技术. AWS在 ...

  2. 公有云开启全面竞争时代——青云QingCloud

    网界网本期[封面报道]公有云开启全面竞争时代 [CNW.com.cn 专稿] 险滩急流之后,公有云[注]服务市场的开拓者们终于看到了一片丰饶之海. 2013年,中国云计算[注]产业起步的第五年,公有云 ...

  3. 公有云厂商DDoS防护产品竞品分析——内含CC的一些简单分析,貌似多是基于规则,CC策略细粒度ip/url//ua/refer

    公有云厂商DDoS防护产品竞品分析 from:http://www.freebuf.com/articles/network/132239.html 行文初衷 由于工作关系,最近接触了很多云上用户,对 ...

  4. 西瓜哥:公有云也“All-Flash”?

    本文转载自 高端存储知识 Gartner在2018年Market Insight: Preparing for the SSD Rise and HDD Demise一文中指出:当闪存介质降到HDD每 ...

  5. Azure China (1) Azure公有云落地中国

    <Windows Azure Platform 系列文章目录> 微软公有云Microsoft Azure已经落地中国,官方网址:http://www.windowsazure.cn/. 在 ...

  6. Windows Azure公有云服务相关方案

    http://www.cnblogs.com/sennly/p/4139675.html 1.公有云平台服务简介 Windows Azure 是一个灵活而开放的云平台,通过该平台,您可以在数据中心快速 ...

  7. [转帖]中国公有云2018H1市场占有率

    IDC:阿里云中国第一 市场份额为2到9名总和   https://news.cnblogs.com/n/617838/ 1 月 21 日,市场研究机构 IDC 日前公布 2018 年上半年中国公有云 ...

  8. (转)公有云vr客户端tcp连接数太多造成 系统卡顿问题 [bittorrent tracker优化] -公有云常见网络问题及思路

    在公有云服务器 发现使用tcp(http)的tracker连接数太多 用户太多会造成windows系统卡顿 特此发表一下修改配置和路由器的方法 解决卡顿问题 解决方法1(参考内容): 修改 /etc/ ...

  9. 微软Azure公有云个人用户是否能支付得起?

    个人建立自己的站点是普通"白领"的愿望.由于,我们的大脑分泌的脑汁须要排泄渠道.怎么办呢? 依据微软公有云的公开报价(Pricing),租用单核CPU.0.75GB内存,20GB硬 ...

随机推荐

  1. 做了一道跑大数据的最短路挂了,基于vector的二维模拟邻接表实现Dijkstra算法(*【模板】)

    代码: #include <stdio.h> #include <string.h> #include <string> #include <vector&g ...

  2. Fabric原理剖析

    Fabric架构   image.png Fabric网络   image.png Fabric模块   image.png Fabric交易流 根据Hyperledger Fabric 1.0架构, ...

  3. codeforces 460A Vasya and Socks 解题报告

    题目链接:http://codeforces.com/problemset/problem/460/A 题目意思:有一个人有 n 对袜子,每天早上会穿一对,然后当天的晚上就会扔掉,不过他会在 m 的倍 ...

  4. poj 1789 Truck History 解题报告

    题目链接:http://poj.org/problem?id=1789 题目意思:给出 N 行,每行7个字符你,统计所有的 行 与 行 之间的差值(就是相同位置下字母不相同),一个位置不相同就为1,依 ...

  5. Kappa:比Lambda更好更灵活的实时处理架构

    为了进一步探讨这种批处理和实时处理有效整合在同一系统的架构,我们将在今天的文章中分析Lambda三层结构模型的适用场景,同时暴露出Lambda架构一个最明显的问题:它需要维护两套分别跑在批处理和实时计 ...

  6. 【前端】CentOS 7 系列教程之一: 安装 node 最新版

    转载请注明出处:http://www.cnblogs.com/shamoyuu/p/linux_1.html 此系列教程从零开始,安装node.mysql.git,nginx.并且设置git自动部署. ...

  7. 动态编译c#脚本(把c#当作脚本执行)

    csscript动态编译C#脚本 This document contains information about the CLR based scripting system CS-Script ( ...

  8. margin-负值

    总结:margin负值的影响: 当元素(块级元素)没有设置宽度时:margin负值会增加元素的宽度,当设置宽度时,margin负值只会影响元素的位置. 就是负的边距好像能减小元素在文档流中的尺寸一样, ...

  9. centos7用lvm扩展xfs文件系统的根分区

    centos7中默认使用的是xfs文件系统,此文件系统的特点,可以另外查找资料,这里说一下对文件系统的扩容: 1.先看一下没扩容之前的分区大小 2.添加一块新磁盘,并进行分区.格式化(格式化的时候用m ...

  10. python学习笔记4-时间函数

    1 time #时间与日期 import time; # This is required to include time module. ticks = time.time() print (&qu ...