阿里大数据产品体系是基于阿里云飞天平台上的数据处理服务。主要分为阿里云大数据基础产品阿里云数加平台,其产品架构图如下所示:

一、阿里云大数据基础产品

1、云数据库——RDS(ApsaraDB for RDS的简称)

  • 稳定可靠、可弹性伸缩的在线数据库服务
  • 即开即用,DMS可视化界面
  • 兼容MySQL,SQL server,PG等关系型数据库
  • 提供数据库在线扩容,备份回滚,性能监控及分析等功能
  • 只读实例和临时实例

优势:

  • 双机热备——秒级切换,服务可用性达99.5%
  • 安全防护——防DDOS攻击,SQL注入警告,数据多重备份
  • 简单易用——一键式数据迁移,可视化管理操作

2、分布式关系型数据库——DRDS(Distributed Relational Database Service)

  • 基于RDS的分布式数据存储和检索产品
  • 水平拆分可平滑扩展
  • 解决用户单RDS无法支撑业务的苦难
  • 降低用户使用分布式数据库的难度

优势:

  • 简单易用——兼容MySQL(交互协议、SQL)
  • 稳定可靠——共享阿里组件
  • 分布式——水平拆分,容量达到单节点百倍
  • 可扩展——增减节点对应用几乎无影响,高效数据迁移

3、表格存储——TS(Table Store)

  • 构建在阿里云飞天分布式系统上的NoSQL数据存储服务
  • 海量结构化数据的存储和实时访问
  • 弹性资源预留
  • 实时监控显示

优势:

  • 稳定——自动故障检测和恢复,系统可用性99.9%
  • 安全——用户级别的数据隔离、访问控制和权限管理,数据冗余备份
  • 大规模——单表到百TB级数据存储
  • 高性能——毫秒级别单行读写延迟,十万级别QPS

4、分析型数据库——ADB(Analytic DB)

  • 海量数据实时高并发在线分析云计算平台
  • 自由的计算和查询能力
  • 高可用性和高安全性
  • 全面兼容MySQL协议

优势:

  • 高度的计算自由——通过SQL进行灵活的多维分析、数据透视、数据筛选等
  • 急速的响应时间——毫秒级的千亿级数据透视,毫秒级的大表关联计算
  • 简单的使用方式——标准SQL,支持标准MySQL协议,内置多种云平台数据的输入输出
  • 丰富的特点功能——高性能自动索引,海量数据的急速导出等

5、大数据计算服务——MaxCompute

  • 针对TP/BP级数据、实时性要求不高的分布式处理能力
  • 大数据运算能力
  • 开箱即用
  • 数据安全

优势:

  • 分布式——分布式集群架构,可灵活扩展
  • 安全性——自动存储容错机制,所有计算都在沙箱进行
  • 易用性——全面支持基于SQL的数据处理,提供标准API,高并发高吞吐量的数据上传下载
  • 管理与授权——多用户管理协同分析数据,多种方式对用户权限管理,灵活的数据访问控制决策

6、数据集成(Data Integration)

数据集成是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台,为阿里云大数据计算引擎提供的离线(批量)数据进出通道。

优势:

  • 多:支持数据源种类多,多样数据通道,齐全的数据传输方式,丰富的数据处理插件;
  • 快:高效的调用方式,强劲的传输速度,强大的吞吐力;
  • 好:健壮的传输通道,智能的错误检测,自动的传输恢复;
  • 省:开箱即用,动态分配,弹性伸展,按需申请,按量付费;

7、对象存储(Object Storage Service,简称OSS)

  • 提供海量、安全、低成本、高可靠的云存储服务;
  • 即开即用,无限大空间的存储集群;
  • 通过API/SDK接口或OSS迁移工具方便将海量数据移入或移除;
  • 存储对象操作具有原子性,强一致性;

优势:

  • 可靠:服务可用性99.99%,数据持久性99.999999999%(9个9),多重备份,规模自动扩展;
  • 安全:用户级别的资源隔离,异地容灾,企业级多层安全防护,多种授权机制;
  • 低成本:多线GBP骨干网络,无带宽限制,上行流量免费;
  • 多种类数据处理能力:图片处理、音视频转码、内容加速分发、鉴黄服务,归档服务等。

二、阿里云数加平台

阿里云数据产品均集成在数加平台,阿里云公共云数加平台的定位:一站式数据平台(集成包括从基础数据分析应用到大数据开发、调度、运维,到机器学习等);提供三层服务(底层计算、数据平台分析工具、应用层服务)行业解决方案。

1、DataWorks(原Data IDE)

数据工场DataWorks(原大数据开发套件Data IDE)是基于MaxCompute作为计算和存储引擎的用于工作流可视化开发和托管调度运维的海量数据离线加工分析平台。

优势:

  • 专业:阿里多年DW/BI经验沉淀,全链路解决方案,高效率低成本;
  • 功能强大:集成式组件服务,多种异构数据源支持,多人协同代码开发,完善的版本管理,分钟、小时级调度、拖拽式数据分析与可视化算法建模;
  • 大数据处理能力:完美融合Max Compute,支持十万级任务的有序运行及管理。

2、Quick BI

提供海量数据实时在线分析服务,支持拖拽式操作,提供了丰富的可视化效果,可以轻松自如地完成数据分析,业务数据探查,报表制作等工作。

优势:

  • 门槛低:拖拽操作,简单易用;
  • 功能强:多样的解决方案,丰富的展现手段;
  • 大数据处理能力:数据分析,数据处理能力强大

3、机器学习PAI

  • 基于MaxCompute、GPU集群,支持MR、MPI、SQL、BSP、SPARK等计算类型;
  • 内置阿里、蚂蚁多年沉淀的分布式算法,支持百亿级数据量训练;
  • WEB界面,通过拖、拉、拽等方式即可完成复杂数据挖掘流程;

优势:

  • 提供从数据预处理到模型评估的一站式平台服务,显著降低大数据算法建模门槛;
  • 支持自定义算法和组件,灵活开放的个性化设置,极大地提高了建模效率;
  • 提供丰富的分布式算法,提高模型精度,助力海量数据中挖掘出业务价值。

【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系的更多相关文章

  1. 大数据实时处理-基于Spark的大数据实时处理及应用技术培训

    随着互联网.移动互联网和物联网的发展,我们已经切实地迎来了一个大数据 的时代.大数据是指无法在一定时间内用常规软件工具对其内容进行抓取.管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的 ...

  2. BL老师的建议,数学不好的,大数据一票否决--后赋从java转大数据

    __________________________ 作者:我是蛋蛋链接:https://www.zhihu.com/question/59593387/answer/167235075来源:知乎著作 ...

  3. MySQL随机获取数据的方法,支持大数据量

    最近做项目,需要做一个从mysql数据库中随机取几条数据出来. 总所周知,order by rand 会死人的..因为本人对大数据量方面的只是了解的很少,无解,去找百度老师..搜索结果千篇一律.特发到 ...

  4. [Hadoop 周边] Hadoop和大数据:60款顶级大数据开源工具(2015-10-27)【转】

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

  5. Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  6. 【转载】Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  7. Druid:一个用于大数据实时处理的开源分布式系统——大数据实时查询和分析的高容错、高性能开源分布式系统

    转自:http://www.36dsj.com/archives/28590 Druid 是一个用于大数据实时查询和分析的高容错.高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分 ...

  8. Data - 【转】数据统计、数据挖掘、大数据、OLAP的区别

    原文链接 数据分析 数据分析是一个大的概念,理论上任何对数据进行计算.处理从而得出一些有意义的结论的过程,都叫数据分析. 从数据本身的复杂程度.以及对数据进行处理的复杂度和深度来看,可以把数据分析分为 ...

  9. C#将dataGridView中显示的数据导出到Excel(大数据量超有用版)

    开发中非常多情况下须要将dataGridView控件中显示的数据结果以Excel或者Word的形式导出来,本例就来实现这个功能. 因为从数据库中查找出某些数据列可能不是必需显示出来,在dataGrid ...

  10. 【MySQL】随机获取数据的方法,支持大数据量

    在mysql中带了随机取数据的函数,在mysql中我们会有rand()函数,很多朋友都会直接使用,如果几百条数据肯定没事,如果几万或百万时你会发现,直接使用是错误的.下面我来介绍随机取数据一些优化方法 ...

随机推荐

  1. 关于Script的猜想和代码设计

    由于现在接触的是蓝图,而之前接触的脚本,这两者有些不一样. 对脚本的设计如果是代码的解析的话, 对蓝图的设计则需要提供一些底层的API. 变量分为:  基础类型 ,复合类型 ,容器类型 NewGlob ...

  2. 常用的adb命令(重要)

    常用的adb命令(重要)

  3. 【Java】图片上传逻辑

    后台逻辑: 后台服务,用Dubbo框架作为一个文件微服务 package cn.ymcd.aisw.service; import cn.ymcd.aisw.dto.RpcResult; /** * ...

  4. 【JavaScript】从N个下拉动态监听改变的option值

    同事因为这个问题人傻了,是从Ajax请求获取的动态数据遍历的表格 然后表格行的单元格又有下拉选择,有N个下拉,要取出选择的值进行二次请求 <select name="A" i ...

  5. 【MySQL】29 索引

    MySQL是一个关系型的数据库 使用标准的SQL数据格语言格式 支持大型数据库,处理千万级别的记录数据 允许多系统运行,支持多种编程语言连接 最重要的一点是MySQL允许定制,采用GPL协议,允许修改 ...

  6. 关于我升级VS16.8,结果一些项目运行报错“Phx.FatalError”这件事

    背景 不知道啥时候开始,一些的项目不能好好运行了.一运行就报错 解决办法 https://developercommunity.visualstudio.com/content/problem/125 ...

  7. 白鲸开源CEO郭炜荣获「2024中国数智化转型升级先锋人物」称号

    2024年7月24日,由数据猿主办,IDC协办,新华社中国经济信息社.上海大数据联盟.上海市数商协会.上海超级计算中心作为支持单位,举办"数智新质·力拓未来 2024企业数智化转型升级发展论 ...

  8. 用GDI+旋转多边形来绘制一个时钟摸拟小程序

    效果图 在头文件类中声明变量 TCHAR m_dayStr[4]; // 日期 TCHAR m_weekStr[4]; // 星期 Gdiplus::Font* m_pFont; // 字体 Gdip ...

  9. windows编程中文件操作的几种方法,C,C++,MFC,Win32sdk

    windows编程中文件操作的几种方法 windows编程中文件操作有以下几种常见方法: 1.C语言中文件操作.2.C++语言中的文件操作.3.Win32 API函数文件操作.4.MFC CFile类 ...

  10. AntSK:在无网络环境中构建你的本地AI知识库的终极指南

    亲爱的读者朋友们,我是许泽宇,今天我将深入探讨一个引人注目的开源工具--AntSK.这个工具让您在没有互联网连接的情况下,仍然能够进行人工智能知识库的对话和查询.想象一下,即使身处无网络环境中,您也可 ...