7月28日,在袋鼠云2022产品发布会上,袋鼠云技术负责人思枢正式宣布旗下产品「大数据基础平台EasyMR」发布。

EasyMR是袋鼠云自研的大数据基础平台,提供Hadoop、Hive、Spark、Trino、HBase、Kafka等组件,完全兼容Apache开源生态;支持企业级安全管控,一键开启LDAP+Kerberos+Ranger认证权限体系;提供一站式运维管理平台,帮助企业快速构建大数据平台,降低运维成本。

结合袋鼠云在数字化领域多年的寸积铢累,此次全新发布的大数据基础平台EasyMR紧跟开源生态的先进技术,不仅可以帮助客户轻松应对海量数据的采集、存储、计算、分析挖掘和数据安全等应用场景,并且对于智能运维的部署、升级、扩缩容、监控等进行全方位支持,真正做到成为企业便捷、智能、高效的“数据底座”。

六大特性打造国产大数据基础平台

不同于十年前的新奇,现在大家已经完全习惯自己身处于“大数据时代”这件事情,所有人都能够深切地感受到大数据对于生活带来的各种改变和便利,数据爆发的时代推动着每个个人、企业、行业,甚至是国家往前走。

当前国际形势风云变幻,中美双边关系的割裂,国家对于信创国产化的大力支持,给国内的大数据行业带来巨大冲击的同时,也带来了全新机遇。

数据基础平台作为一切的基础和底座,自然成为国产替代的重中之重。只有真正拥有了自主可控的平台建设能力,才能逐步建立基于自己的 IT 底层架构和标准,形成自有开放生态。

EasyMR就是这样一款自主研发、完全可控的,致力于助力企业信息化智慧转型的“企业数据底座”。

下面通过描述EasyMR的主要特性,来具体说说,EasyMR是如何帮助企业实现智能的?

● 界面化集群运维

Hadoop集群、大数据平台在日常运维中涉及到的节点扩容缩容、组件停止启动、服务滚动重启、服务参数修改、版本升级与回滚等多种运维操作,通过逻辑化、流程化的产品界面展现,方便运维人员操作和监控,提高运维效率。

● 自动化部署

EasyMR通过规范化的步骤和参数约定制作出产品安装包,发布包中的Schema文件中配置了安装包中所有的服务,包含各服务的配置参数、健康检查参数,服务之间的依赖关系等。产品部署时可根据Schema中的相关配置实现一键全自动化部署。

● 仪表盘集群监控

通过集成开源的Promethus和Grafana,实现对集群、服务、节点的核心参数监控,并通过灵活形象的仪表盘进行数据展现。包含CPU占用率,RAM使用率、磁盘空间、IO读写速率等核心参数进行监控,实时掌握集群、服务、节点的运行状态,降低运维故障率。同时,支持用户自建仪表盘及监控项,实现自定义监控项。

● 实时告警

支持实时监控集群中各组件服务的运行指标,如CPU、内存、磁盘、读写IO等,并支持短信、钉钉、邮件告警通道配置,集成多种第三方消息插件。当集群服务出现异常时,可触发告警条件,系统将及时通知接收人。

● 强扩展性

通过自研的Easyagent Server抽象出七大REST接口,安装、启动、停止、更新、配置修改、卸载、执行等与上层应用进行交互,可使agent类别和功能可轻松无限扩展。

● 安全稳定

数据安全、产品安全是大数据产品需要重点考虑的问题。EasyMR在产品设计中过滤掉rm、drop等命令行,防止对数据库的误操作,通过更加安全的方式执行相关命令。同时提供服务的滚动重启、产品的断电重启,解决运维时服务不停止运行的场景并节省运维时间。

丰富的大数据组件夯实数据基座

EasyMR支持Hadoop2.8.5、Hadoop3.2.1大数据集群搭建,支持丰富的大数据组件,用户可以根据业务需要进行组件的选择。

那么,EasyMR具体支持那些大数据组件呢?

● Yarn

版本支持:

· Yarn 支持Hadoop 2.8.5、3.2.1

主要功能为Hadoop的资源调度器,负责管理整个Hadoop集群的资源(CPU和内存)管理和调度。

● Hdfs

版本支持:

· Hdfs 支持Hadoop 2.8.5、3.2.1

Hdfs即Hadoop 分布式文件系统,是Hadoop的三大基础组件之一,主要是处理大数据场景下数据的增、删、改、查、文件切片等功能。

● Flink

版本支持:

· Flink 1.12

面向数据流处理和批量数据处理的可分布式的开源计算框架。

● Spark

版本支持:

· Spark 2.4.8

基于内存的新一代分布式开源大数据框架,支持离线,实时计算,也支持 SQL 语法以及机器学习的处理。

EasyMR对开源组件的SQL的DDL能力进行了增强,支持Add Column语法。

● Hive

版本支持:

· Hive 2.3.8

· Hive 3.1.2

基于Hadoop的一套离线数据处理系统,在HDFS之上提供了结构化的表数据的管理能力,提供类 SQL 的查询语法进行数据分析处理。

● Trino

版本支持:

· Trino 0.359

分布式SQL查询引擎, 用来专门进行高速、实时的数据分析。

EasyMR对Trino的Connector进行了增强,支持Connector的动态加载;对社区的Connector进行了扩展,支持星环Inceptor插件。

● Hbase

版本支持:

· Hbase 1.3.5

· Hbase 2.3.4

一款高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。

● Zookeeper

版本支持:

· Zookeeper 3.6.2

分布式应用程序协调服务,分布式应用程序可基于它实现同步服务,配置维护和命名服务等,为分布式集群提供一种可靠、可扩展、分布式、可配置的协调机制来统一系统的状态。

一起进行一次安装部署吧

其中,简洁、易上手也是EasyMR的一大优势。EasyMR既希望帮助企业实现多源数据的高效集成,全量数据的高效分析,同时也希望能够降低平台的使用门槛,不会让上手难度成为影响企业数字化转型进程的一道壁垒。

所以,和我们一起进行一次大数据产品的安装部署吧!

创建集群

EasyMR支持多集群的统一管理。

基于物理机/虚拟机进行主机集群创建。

「添加主机」,通过账号接入、命令行接入的方式进行主机节点的添加



上传组件安装包

选择平台已有的组件安装包进行安装部署,或者通过本地上传、网络上传的方式上传自己的组件安装包。

一键快速自动化部署

EasyMR支持单个产品包的手动部署和多个产品包的自动部署两种部署方式。

自动部署通过上传产品线定义组件部署流程,平台解析筛选相关组件,根据定义的主机角色实现自动资源自动编排,平台根据依赖关系完成组件的顺序部署,大大节省了运维逐个部署、资源配置的时间。

产品安装过程中,我们可以实时看到服务部署进度、查看部署日志,服务部署情况一目了然。

7*24小时实时监控告警

EasyMR通过集成开源的promethus和grafana,实现对集群、服务、节点的核心参数监控,并通过灵活形象的仪表盘进行数据展现。包含CPU占用率,RAM使用率、磁盘空间、I/O读写速率等核心参数进行监控,实时掌握集群、服务、节点的运行状态,降低运维故障率。同时,支持用户自建仪表盘及监控项,实现自定义监控项。

设置告警规则

平台提供 “短信通道、邮件通道、钉钉通道、企业微信通道、自定义通道” 5种通道配置,用户根据需要选择合适通道并填写通道配置信息、消息模板、地址等完成通道配置。



写在最后

没错,EasyMR就是这样一款好用、易用、高效的大数据基础工具,覆盖企业服务监控运维、组件的升级与回滚、离线数据分析、流式数据处理等多种应用场景。

未来EasyMR将坚持自主创新,不断进化,将积累的大数据实践经验复制到更多的企业。

袋鼠云开源框架钉钉技术交流qun(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack/Taier

他来了!袋鼠云大数据基础平台EasyMR正式上线的更多相关文章

  1. 宜人贷PaaS数据服务平台Genie:技术架构及功能

    上篇:架构及组件 一.数据平台的发展 1.1 背景介绍 随着数据时代的到来,数据量和数据复杂度的增加推动了数据工程领域的快速发展.为了满足各类数据获取/计算等需求,业内涌现出了诸多解决方案.但大部分方 ...

  2. 阿里云大数据三次技术突围:Greenplum、Hadoop和“飞天”

    阿里云大数据三次技术突围:Greenplum.Hadoop和"飞天"    对于企业来说,到底什么是云计算?相信很多企业都有这样的困惑,让我们一起回到这个原始的起点探讨究竟什么是云 ...

  3. 阿里云大数据计算服务 - MaxCompute (原名 ODPS)

    MaxCompute 是阿里EB级计算平台,经过十年磨砺,它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务.去年MaxCompute 做了哪些工作,这些工作背后的原因是什么?大数据市场进入 ...

  4. 基于 SOA 的组件化业务基础平台

    业务基础平台是业务逻辑应用和基础架构平台之间的一个中间层,解决 “应用软件的业务描述和操作系统平台.软件基础架构平台之间的交互与管理问题”.操作系统平台解决了“应用软件系统与硬件之间的交互与管理问题” ...

  5. [置顶] 提高生产力:Web开发基础平台WebCommon的设计和实现

    Web开发中,存在着各种各样的重复性的工作.为了提高开发效率,不在当码农,我在思考和实践如何搭建一个Web开发的基础平台. Web开发基础平台的目标和功能 1.提供一套基础的开发环境,整合了常用的框架 ...

  6. 大数据竞赛平台——Kaggle 入门

    Reference: http://blog.csdn.net/witnessai1/article/details/52612012 Kaggle是一个数据分析的竞赛平台,网址:https://ww ...

  7. Github开源项目(企业信息化基础平台)

    JEEPlatform 一款企业信息化开发基础平台,可以用于快速构建企业后台管理系统,集成了OA(办公自动化).SCM(供应链系统).ERP(企业资源管理系统).CMS(内容管理系统).CRM(客户关 ...

  8. 某公司基于FineBI数据决策平台的试运行分析报告

    一.数据平台的软硬件环境 二.组织机构和权限体系 组织机构:平台中已集成一套组织机构,可以建立部门.人员.也可以与现有系统的组织机构集成,将组织机构导入到平台中. 功能权限:通过配置功能点URL的方式 ...

  9. 打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

    导读:传统ETL方案让企业难以承受数据集成之重,基于Kafka Connect构建的新型实时数据集成平台被寄予厚望. 在4月21日的Kafka Beijing Meetup第四场活动上,DataPip ...

  10. SpringBoot开源项目(企业信息化基础平台)

    JEEPlatform 一款企业信息化开发基础平台,可以用于快速构建企业后台管理系统,集成了OA(办公自动化).SCM(供应链系统).ERP(企业资源管理系统).CMS(内容管理系统).CRM(客户关 ...

随机推荐

  1. 安装卸载GNOME

    只需要三步:sudo yum -y groups install "GNOME Desktop"sudo systemctl set-default graphical.targe ...

  2. StringBuilder的介绍、构造方法及成员方法

    1.StringBuilder的介绍 1.StringBuilder是字符串缓冲区,可以认为是一种容器,能装任何类型的数据,但被装入的数据都会变为字符串 如图 无论是什么类型的数据,被装入字符串缓冲区 ...

  3. 【虚拟机】Windows(x86)上部署ARM虚拟机(Ubuntu)

    [虚拟机]Windows(x86)上部署ARM虚拟机(Ubuntu) 零.起因 最近在学嵌入式,这就不得不涉及ARM指令集,但是电脑是x86指令集的,用手机不太方便,买开发板又要等几天--,总之就是要 ...

  4. java程序乱码问题

    1.字符编码简介 字符编码从字面上理解,就是将字符编码为由多个bits(0或1)组成的字节序列.但字符和字节序列的映射并不是直接的,可简要概括为2个步骤,第1步由字符映射到unicode码,第2步由u ...

  5. windows切换nodejs版本

    卸载之前的nodejs 第一步:下载nvm并安装 (推荐使用nvm-setup.zip) https://github.com/coreybutler/nvm-windows/releases 第二步 ...

  6. 还有的时候,会遇到DataGrid里面嵌套DataGrid(重叠嵌套),然后里面的鼠标滚轮无法响应外面的滚动,为此记录下解决方案

    与上一篇区别在于,详情里面的模板通常是通用的,被定义在样式文件中,被重复使用,因此无法为其添加后台代码,如果能添加后台代码,请翻阅第一篇:所以需要用到命令的方式来辅助事件的抛出,当然还可以利用第三方库 ...

  7. liunx git 免密码登录

    vscode远程git或在linux环境使用git时,每次clone都要输入帐号密码,很不方便,可以使用下面一行命令,系统会记录你输入的下一次帐号密码.(明文记录,注意规避风险)   # 执行   g ...

  8. chrome “从 Google 获取图片说明”

    右键菜单"从 Google 获取图片说明"多余去掉. 设置-高级-使用硬件加速模式(如果可用)-关闭 在用户使用上firefox完胜chrome,但是firefox的开发人员工具相 ...

  9. Docker自定义镜像输出日志

    概述 本文主要解决Docker自定义镜像之后,通过docker logs命令查看不到相关日志的问题 在 Docker 中自定义镜像输出日志,通常需要确保你的应用程序将日志输出到 标准输出(stdout ...

  10. ESP32S3 BLE_HID的编程实现

    ESP32S3 BLE_HID的编程实现 BLE是低功耗蓝牙,HID是Human Interface Device,也就是人机接口设备. 主要用于无线连接并传输用户输入数据(如按键.触控.手势等). ...