阿里大数据产品体系是基于阿里云飞天平台上的数据处理服务。主要分为阿里云大数据基础产品和阿里云数加平台，其产品架构图如下所示：

一、阿里云大数据基础产品

1、云数据库——RDS（ApsaraDB for RDS的简称）

稳定可靠、可弹性伸缩的在线数据库服务
即开即用，DMS可视化界面
兼容MySQL，SQL server，PG等关系型数据库
提供数据库在线扩容，备份回滚，性能监控及分析等功能
只读实例和临时实例

优势：

双机热备——秒级切换，服务可用性达99.5%
安全防护——防DDOS攻击，SQL注入警告，数据多重备份
简单易用——一键式数据迁移，可视化管理操作

2、分布式关系型数据库——DRDS（Distributed Relational Database Service）

基于RDS的分布式数据存储和检索产品
水平拆分可平滑扩展
解决用户单RDS无法支撑业务的苦难
降低用户使用分布式数据库的难度

优势：

简单易用——兼容MySQL(交互协议、SQL)
稳定可靠——共享阿里组件
分布式——水平拆分，容量达到单节点百倍
可扩展——增减节点对应用几乎无影响，高效数据迁移

3、表格存储——TS（Table Store）

构建在阿里云飞天分布式系统上的NoSQL数据存储服务
海量结构化数据的存储和实时访问
弹性资源预留
实时监控显示

优势：

稳定——自动故障检测和恢复，系统可用性99.9%
安全——用户级别的数据隔离、访问控制和权限管理，数据冗余备份
大规模——单表到百TB级数据存储
高性能——毫秒级别单行读写延迟，十万级别QPS

4、分析型数据库——ADB（Analytic DB）

海量数据实时高并发在线分析云计算平台
自由的计算和查询能力
高可用性和高安全性
全面兼容MySQL协议

优势：

高度的计算自由——通过SQL进行灵活的多维分析、数据透视、数据筛选等
急速的响应时间——毫秒级的千亿级数据透视，毫秒级的大表关联计算
简单的使用方式——标准SQL,支持标准MySQL协议，内置多种云平台数据的输入输出
丰富的特点功能——高性能自动索引，海量数据的急速导出等

5、大数据计算服务——MaxCompute

针对TP/BP级数据、实时性要求不高的分布式处理能力
大数据运算能力
开箱即用
数据安全

优势：

分布式——分布式集群架构，可灵活扩展
安全性——自动存储容错机制，所有计算都在沙箱进行
易用性——全面支持基于SQL的数据处理，提供标准API,高并发高吞吐量的数据上传下载
管理与授权——多用户管理协同分析数据，多种方式对用户权限管理，灵活的数据访问控制决策

6、数据集成（Data Integration）

数据集成是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台，为阿里云大数据计算引擎提供的离线（批量）数据进出通道。

优势：

多：支持数据源种类多，多样数据通道，齐全的数据传输方式，丰富的数据处理插件；
快：高效的调用方式，强劲的传输速度，强大的吞吐力；
好：健壮的传输通道，智能的错误检测，自动的传输恢复；
省：开箱即用，动态分配，弹性伸展，按需申请，按量付费；

7、对象存储（Object Storage Service，简称OSS）

提供海量、安全、低成本、高可靠的云存储服务；
即开即用，无限大空间的存储集群；
通过API/SDK接口或OSS迁移工具方便将海量数据移入或移除；
存储对象操作具有原子性，强一致性；

优势：

可靠：服务可用性99.99%，数据持久性99.999999999%（9个9），多重备份，规模自动扩展；
安全：用户级别的资源隔离，异地容灾，企业级多层安全防护，多种授权机制；
低成本：多线GBP骨干网络，无带宽限制，上行流量免费；
多种类数据处理能力：图片处理、音视频转码、内容加速分发、鉴黄服务，归档服务等。

二、阿里云数加平台

阿里云数据产品均集成在数加平台，阿里云公共云数加平台的定位：一站式数据平台（集成包括从基础数据分析应用到大数据开发、调度、运维，到机器学习等）；提供三层服务（底层计算、数据平台分析工具、应用层服务）行业解决方案。

1、DataWorks（原Data IDE）

数据工场DataWorks（原大数据开发套件Data IDE）是基于MaxCompute作为计算和存储引擎的用于工作流可视化开发和托管调度运维的海量数据离线加工分析平台。

优势：

专业：阿里多年DW/BI经验沉淀，全链路解决方案，高效率低成本；
功能强大：集成式组件服务，多种异构数据源支持，多人协同代码开发，完善的版本管理，分钟、小时级调度、拖拽式数据分析与可视化算法建模；
大数据处理能力：完美融合Max Compute，支持十万级任务的有序运行及管理。

2、Quick BI

提供海量数据实时在线分析服务，支持拖拽式操作，提供了丰富的可视化效果，可以轻松自如地完成数据分析，业务数据探查，报表制作等工作。

优势：

门槛低：拖拽操作，简单易用；
功能强：多样的解决方案，丰富的展现手段；
大数据处理能力：数据分析，数据处理能力强大

3、机器学习PAI

基于MaxCompute、GPU集群，支持MR、MPI、SQL、BSP、SPARK等计算类型；
内置阿里、蚂蚁多年沉淀的分布式算法，支持百亿级数据量训练；
WEB界面，通过拖、拉、拽等方式即可完成复杂数据挖掘流程；

优势：

提供从数据预处理到模型评估的一站式平台服务，显著降低大数据算法建模门槛；
支持自定义算法和组件，灵活开放的个性化设置，极大地提高了建模效率；
提供丰富的分布式算法，提高模型精度，助力海量数据中挖掘出业务价值。

【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系的更多相关文章

大数据实时处理-基于Spark的大数据实时处理及应用技术培训
随着互联网.移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代.大数据是指无法在一定时间内用常规软件工具对其内容进行抓取.管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的 ...
BL老师的建议，数学不好的，大数据一票否决--后赋从java转大数据
__________________________ 作者:我是蛋蛋链接:https://www.zhihu.com/question/59593387/answer/167235075来源:知乎著作 ...
MySQL随机获取数据的方法，支持大数据量
最近做项目,需要做一个从mysql数据库中随机取几条数据出来. 总所周知,order by rand 会死人的..因为本人对大数据量方面的只是了解的很少,无解,去找百度老师..搜索结果千篇一律.特发到 ...
[Hadoop 周边] Hadoop和大数据：60款顶级大数据开源工具（2015-10-27）【转】
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
【转载】Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
Druid：一个用于大数据实时处理的开源分布式系统——大数据实时查询和分析的高容错、高性能开源分布式系统
转自:http://www.36dsj.com/archives/28590 Druid 是一个用于大数据实时查询和分析的高容错.高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分 ...
Data - 【转】数据统计、数据挖掘、大数据、OLAP的区别
原文链接数据分析数据分析是一个大的概念,理论上任何对数据进行计算.处理从而得出一些有意义的结论的过程,都叫数据分析. 从数据本身的复杂程度.以及对数据进行处理的复杂度和深度来看,可以把数据分析分为 ...
C#将dataGridView中显示的数据导出到Excel（大数据量超有用版）
开发中非常多情况下须要将dataGridView控件中显示的数据结果以Excel或者Word的形式导出来,本例就来实现这个功能. 因为从数据库中查找出某些数据列可能不是必需显示出来,在dataGrid ...
【MySQL】随机获取数据的方法，支持大数据量
在mysql中带了随机取数据的函数,在mysql中我们会有rand()函数,很多朋友都会直接使用,如果几百条数据肯定没事,如果几万或百万时你会发现,直接使用是错误的.下面我来介绍随机取数据一些优化方法 ...

随机推荐

单细胞测序最好的教程（十四）测序原始数据公开至NCBI数据库
作者按国内对于单细胞测序相关的中文教程确实不够全面,当然NCBI官网给的上传教程也比较详细了,所以变成了会者不难.本教程你现在可能用不上,但是你如果做单细胞测序,那么未来你一定会用上,建议收藏. 在 ...
移植自淘宝店家的，硬件SPI通讯3.5寸TFT,LCD屏幕。MSPM0G3507
适用MSPM0G3507 LP开发板 3.5寸TFTLCD屏,SPI通讯项目是CCStheia的特点:硬件SPI,速度更快,可以在syscfg中自行修改引脚蓝奏云: https://wwo.la ...
第一讲：日志系统：一条sql更新语句是如何执行的？
目录第一讲:日志系统:一条sql更新语句是如何执行的? 回顾抛出问题: 提出思路: 重要的日志模块:redo log 重要的日志模块:binlog 为什么会有两份日志呢? 这两种日志有以下三点不同 ...
【Java】JDBC Part4 Transaction 事务
JDBC Part4 Transaction 事务什么是事务? 事务是应用程序中一系列严密的操作,所有操作必须成功完成,否则在每个操作中所作的所有更改都会被撤消. 也就是原子性,一个事务中的一系列的 ...
【Linux】Re03
一.软连接语法用法 ln -s 源文件或者目录位置链接名称 [root@localhost ~]# mkdir -p aa/bb/cc/dd [root@localhost ~]# ln -s a ...
如果美国断供中国所有的Intel和AMD芯片，国内各行各业会不会崩溃
说一个我个人观点,我认为如果国内完全没有X86芯片的供应,那么各行各业的发展会明显进入发展迟缓阶段,首先受影响的就是软件开发领域,因为没有新的芯片也就意味着袋电脑性能停滞或者倒退,那么开发出新的更耗资 ...
git警告信息：Encountered 1 file(s) that may not have been copied correctly on Windows: —— See: `git lfs help smudge` for more details.
git报警信息: 官方讨论的帖子: https://github.com/git-lfs/git-lfs/issues/2434 说下个人的理解: 在git管理中,对于大文件(一般为压缩后的二进制文件 ...
Redis中的Hash类型常用命令
一.hset命令作用:设置hash类型值:格式:hset key field value案例:192.168.0.111:0>hset product name 苹果"1" ...
java中线程的6中状态
1.背景编写多线程相关的程序,必然会用到线程状态的相关知识点, 那么这篇博客就给大家系统的分析一下多线程的状态, 由于java中线程状态与操作系统中的线程状态划分有区别, 因此这里优先介绍操作系统的 ...
神经网络之卷积篇：详解Padding
详解Padding 为了构建深度神经网络,需要学会使用的一个基本的卷积操作就是padding,让来看看它是如何工作的. 如果用一个3×3的过滤器卷积一个6×6的图像,最后会得到一个4×4的输出,也就是 ...

【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系