一.NTP 配置时间服务器1.1.检查当前系统时区1.2.同步时间1.3.检查软件包1.4.修改 ntp 配置文件1.5.重启 ntp 服务1.6.设置定时同步任务二.Linux 集群服务群起脚本2.1.介绍2.2.编写脚本三.CentOS6.8 升级到 python 到 2.73.1.环境准备3.2.安装 Python2.7 一.NTP 配置时间服务器   当集群中各个节点的时间不同步,误差超过某个范围时,会导致一些集群的服务无法正常进行,这时我们应该想办法做一个定时同步集群所有节点时间的任务…
本文章经授权转载,原文链接: https://blog.csdn.net/MiaoSO/article/details/104770720 目录 2. 集群规划 2.1 集群配置 2.2 软件版本 2.3 集群规划 3. 环境准备 3.1 基础软件准备(必装项请自行安装) 3.2 pip.kazoo 安装 3.3 创建部署用户 3.4 对部署用户配置免密 3.5 dolphinscheduler 安装包下载 2. 集群规划 2.1 集群配置 略 2.2 软件版本 软件 版本 CDH Cloude…
一.项目背景二.项目架构三.项目实现3.1.数据生产3.1.1.数据结构3.1.2.编写代码3.1.3.打包测试3.2.数据采集/消费(存储)3.2.1.数据采集:采集实时产生的数据到 kafka 集群3.2.2.编写代码:数据消费(HBase)3.2.3.编写测试单元:范围查找数据(本方案已弃用,但需掌握)3.2.4.运行测试:HBase 消费数据3.2.5.编写代码:优化数据存储方案3.2.6.运行测试:协处理器3.2.7.编写测试单元:范围查找数据 一.项目背景   通信运营商每时每刻会产…
3.3.数据分析3.3.1.Mysql 表结构设计3.3.2.需求:按照不同的维度统计通话3.3.3.环境准备3.3.4.编写代码:数据分析3.3.5.运行测试3.3.6.bug 解决 3.3.数据分析   我们的数据已经完整的采集到了 HBase 集群中,这次我们需要对采集到的数据进行分析,统计出我们想要的结果.注意,在分析的过程中,我们不一定会采取一个业务指标对应一个 mapreduce-job 的方式,如果情景允许,我们会采取一个 mapreduce 分析多个业务指标的方式来进行任务.具体…
本次主要采用的是python3的第三方库xlwt,来创建一个excel文件.具体步骤如下: 1.确认存储位置,文件命名跟随时间格式 2.封装写入格式 3.实现随机数列生成 4.定位行和列把随机数写入 5.统一写入条目数,实现入参确认条目 6.封装对文件夹内多余数据表的删除操作. 说明:最大支持60000条,这个是由于excel格式限制的,如果对大数据有更高要求的如,写入6000000数据的话可以进行循环获取到100个excel来导入. 实际文件生成效果图: 文件内容格式如下图 源码如下: imp…
原文:http://my.oschina.net/ydsakyclguozi/blog/374564 最近好不容易抽空研究了下Cobar,感觉这个产品确实很不错(在文档方面比Amoeba强多了),特此推荐给大家.Cobar是阿里巴巴研发的关系型数据的分布式处理系统,该产品成功替代了原先基于Oracle的数据存储方案,目前已经接管了3000+个MySQL数据库的schema,平均每天处理近50亿次的SQL执行请求. 首先,使用Cobar的核心功能如下: 分布式:Cobar的分布式主要是通过将表放入…
转自:http://blog.csdn.net/shagoo/article/details/8191346 最近好不容易抽空研究了下Cobar,感觉这个产品确实很不错(在文档方面比Amoeba强多了),特此推荐给大家.Cobar是阿里巴巴研发的关系型数据的分布式处理系统,该产品成功替代了原先基于Oracle的数据存储方案,目前已经接管了3000+个MySQL数据库的schema,平均每天处理近50亿次的SQL执行请求. 首先,使用Cobar的核心功能如下: 分布式:Cobar的分布式主要是通过…
前文我们聊到了mongodb的副本集以及配置副本集,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/13953598.html:今天我们来聊下mongodb的分片: 1.什么是分片?为什么要分片? 我们知道数据库服务器一般出现瓶颈是在磁盘io上,或者高并发网络io,又或者单台server的cpu.内存等等一系列原因:于是,为了解决这些瓶颈问题,我们就必须扩展服务器性能:通常扩展服务器有向上扩展和向外扩展:所谓向上扩展就是给服务器加更大的磁盘,使用更大更好的内…
数据参考:http://www.datastax.com/documentation/cassandra/1.2/webhelp/index.html#cassandra/architecture/architecturePlanningAbout_c.html 当规划一个Cassandra集群部署时,关于你初始存储的数据的数据量你应当有一个好的想法,并且对于程序的工作量有一个很好的预计. 下面是规划集群时需要考虑的: 1.选择企业实现级别的硬件: 根据下列资源选择适当的硬件:CPU.内存.平衡…
Service Fabric 部署集群:https://docs.microsoft.com/zh-cn/azure/service-fabric/service-fabric-get-started-standalone-cluster 下载安装包 配置文件 切换到相关目录下,执行powsershell命令,执行脚本时,使用对应的配置文件 注意:防火墙允许集群访问(防火墙入栈规则) 开这些端口: 135, 137, 138, 139, 445, 21000, 21001, 21002, 210…