https://www.cnblogs.com/1ssqq1lxr/p/10417005.html 由于公司业务需求,需要搭建一套实时处理数据平台,基于多方面调研选择了Flink. 初始化Swarm环境(也可以选择k8s) 部署zookeeper集群 基于docker-compose ,使用 docker stack 部署在容器中,由于zookeeper存在数据持久化存储,这块后面可以考虑共享存储方案. services: zoo1: image: zookeeper restart: alwa…
携程大数据平台负责人张翼分享携程的实时大数据平台的迭代,按照时间线介绍采用的技术以及踩过的坑.携程最初基于稳定和成熟度选择了Storm+Kafka,解决了数据共享.资源控制.监控告警.依赖管理等问题之后基本上覆盖了携程所有的技术团队.今年的两个新尝试是Streaming CQL(华为开源)和JStorm(阿里开源),意在提升开发效率.性能和处理消息拥塞能力,目前已有三分之一的Storm应用已经迁到JStorm 2.1上. 今天给大家分享的是携程在实时数据平台的一些实践,按照时间顺序来分享我们是怎…
文 | 陈肃 DataPipeline  CTO 随着企业应用复杂性的上升和微服务架构的流行,数据正变得越来越以应用为中心. 服务之间仅在必要时以接口或者消息队列方式进行数据交互,从而避免了构建单一数据库集群来支撑不断增长的业务需要.以应用为中心的数据持久化架构,在带来可伸缩性好处的同时,也给数据的融合计算带来了障碍. 由于数据散落在不同的数据库.消息队列.文件系统中,计算平台如果直接访问这些数据,会遇到可访问性和数据传输延迟等问题.在一些场景下,计算平台直接访问应用系统数据库会对系统吞吐造成显…
私有云是为一个客户单独使用而构建的,因而提供对数据.安全性和服务质量的最有效控制.前置条件是客户拥有基础设施,并可以使用基础设施在其上部署应用程序.其核心属性是专有的资源.本篇文章将会结合网易云信的实践经验,以全局概述的方式带大家认识点播私有化平台构建的整体架构面貌. 推荐阅读 <几十万人同时在线的直播间聊天,如何设计服务端架构?> <高并发IM系统架构优化实践> 云计算的出现,通过硬件的虚拟化将大量的服务器硬件抽象为巨大的资源池,可以动态的为用户提供基础设施.平台和应用三种形式的…
基于Docker构建企业Jenkins CI平台 一.什么是CI 持续集成(Continuous integration)是一种软件开发实践,每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误. 二.CI工具 持续集成工具:jenkins 构建工具:maven 版本控制库:git 镜像仓库:harbor 三.CI流程 工作流程: 1. 开发人员提交代码到Git版本仓库; 2. Jenkins人工/定时触发项目构建; 3. Jenkins拉取代码.代码编码.打包…
如何基于Go搭建一个大数据平台 - Go中国 - CSDN博客 https://blog.csdn.net/ra681t58cjxsgckj31/article/details/78333775 017年10月18日 00:00:00 Go中国 阅读数:470   大家下午好!我是来自七牛云大数据团队的党合萱.今天向大家介绍一下我们是如何基于Go搭建大数据平台的. 七牛的大数据的产品——Pandora 首先介绍一下七牛的大数据的产品——Pandora,我们的目的是提供简单.高效和开放的大数据平台…
本篇博客重点介绍如何使用Kylin来构建大数据分析平台.根据官网介绍,其实部署Kylin非常简单,称为非侵入式安装,也就是不需要去修改已有的 Hadoop大数据平台.你只需要根据的环境下载适合的Kylin安装包,选择一个Hadoop节点部署即可,Kylin使用标准的Hadoop API跟各个组件进行通信,不需要对现有的Hadoop安装额外的Agent. Kylin部署的架构是一个分层的结构,最底层是数据来源层,我们可以通过Sqoop等工具将数据迁移到HDFS分布式文件系统.Kylin依赖Hado…
在日常工作中,有时候需要到远程服务器上部署新版本的系统,由于远程服务器出于外网,所以每次都要开QQ连接,非常麻烦.索性就研究了下IHttpasyncHandler,并结合Juqery ProgressBar,打造了一款大文件传送器.其基本原理就是首先在客户端将大文件分段拆分,然后写入内存流,最后发送到服务器上.在上传的同时,会利用异步Handler来获取当前进度并推送到前台显示.图示效果如下(当前缓存设置为5000字节大小): 图示结果 (图1,传送到36%的时候) (图2,传送到100%的时候…
持续集成(Continuous Integration,CI):代码合并.构建.部署.测试都在一起,不断地执行这个过程,并对结果反馈. 持续部署(Continuous Deployment,CD):部署到测试环境.预生产环境.生产环境. 持续交付(Continuous Delivery,CD):将最终产品发布到生产环境,给用户使用. 高效的CI/CD环境可以获得: • 及时发现问题 • 大幅度减少故障率 • 加快迭代速度 • 减少时间成本   环境准备: 1.部署gitlab 1.1 部署git…
https://mp.weixin.qq.com/s/MGnG_Mpf6CUQWLJHvmWqLA…