分享嘉宾李婧玮(捷熙) 阿里云数据库资深产品经理

整理墨天轮社区

导读

大家好,我是来自阿里云的捷熙。AnalyticDB是融合数据库、大数据技术于一体的云原生企业级数据仓库平台,今天我为大家带来的分享分为三个方面:AnalyticDB的诞生背景、AnalyticDB产品介绍、AnalyticDB 应用场景。

市场的挑战和趋势

1、全球市场的挑战

从全球市场上看,数据呈现出一个爆炸式的增长的趋势,更加偏向于生产处理的实时化,以及生产处理的智能化,数据库也正在朝着云原生的方向发展。



图1 全球市场挑战

2、业务趋势

数据变化的趋势也对数据处理带来了挑战。

首先要实现数据强一致,我们希望在数据的输入与处理中,保证数据不丢失。

第二点是做到分析实时性,对多元的数据源进行统一以及实时性分析。在过去更多的是做“T+1”的数据工作,即当天产生的数据需要在第二天来做处理与分析,而在当下我们希望能够演进到“T+0”的数据分析效果。

第三点的挑战来自数据系统的复杂性。在面对各种各样的数据源与数据分析系统,需要我们保留同一份数据的情况下进行多模与多元化的分析。

最后,学习与运维成本高的情况下,需要我们实现自运维。我们希望数据库从客户层面实现自运维、自恢复。



图2 数据处理面临新挑战

3、技术发展趋势

数据库的发展历经了从商业——开源——分析——异构——云原生、一体化分析式、多模、HTAP的不同阶段。基于云计算技术能够实现资源的高效池化和隔离,因此在下一个阶段我们希望在云计算技术基础之上,研发云原生和一体化分布式的数据库。



图3 数据库发展历程

下图是数据库在技术架构上的变化,从单节点逐渐演进到统一元数据。



图4 数据库架构发展演进

AnalyticDB产品介绍

1、构建新一代数据存储、处理方案

AnalyticDB是云原生数据仓库与数据构建的新一代数据存储处理方案的产品。

底层支持各式的数据源以及数据处理,数据的传输通过通过ETL的方式传输到数据湖中间。目前提供两种不同的生态,AnalyticDB MySQL版以及AnalyticDB PostgreSQL版。同时,我们也会支持一体化数据管理同步加工的工具帮助数据实现一站式的服务。



图5 云原生产品架构

2、人人可用的数据分析

作为融合数据库、大数据技术于一体的云原生企业级数据仓库服务,AnalyticDB具有以下六点优势:

  • 标准SQL,简单易用:会SQL就会数据分析,就会用大数据;
  • 云原生:存算分离,秒级弹性扩缩容
  • 低成本:按需存储,冷热数据分层,存储成本下降3-10倍
  • 性能强劲:在2020年TPC权威测评中位列全球第一
  • 数据共享:真正跨实例的“一写多读”,避免数据孤岛
  • 湖仓一体:原生湖仓一体的数据分析平台

除此之外,AnalyticDB基于行列存储、混合负载管理、智能索引、融合计算引擎这几项技术的提供,从而在使用中能够满足以下三种应用场景,多维分析明细查询实时高吞吐查询和写入



图6 AnalyticDB设计愿景

作为拥有完全自主知识产权的数据仓库产品,AnalyticDB获得了专业领域的认可并通过多项测评。在2020年5月全球权威数仓性能评测 TPC-H中,AnalyticDB PostgreSQL版荣获第一;在2020年6月全球权威数仓性能评测 TPC-DS中,AnalyticDB MySQL版荣获第一。



图7 AnalyticDB获得专业领域认可

3、云原生产品架构

下面展示AnalyticDB的产品架构,MPP数据库架构+在离线一体化+Serverless。

第一层是接入层,中间为计算层,第三层是存储层。其中计算层提供了不同的计算引擎,可以配置不同的资源组,来实现不同的计算和查询的融合分析的服务。



图8 AnalyticDB产品架构

同时AnalyticDB 提供了冷热数据分层的技术,帮助实现冷热分层、冷热策略轻松定义、冷热分区自动迁移、外部接口统一、内部闭环实现。



图9 AnalyticDB提供冷热数据分层技术

不仅如此,我们可以通过资源组来支持不同的计算引擎的混合负载。

客户通过接入层进入到数据库之后,可以分一个资源组作为默认资源组用于在线分析,也可以用一个新的资源组用于落盘的分析,在另外一个新的资源组上面去做算法分析。

所有的分析服务都可以通过不同的资源组的维度来提供,在同一个实例上面可以支持多种的数据场景,从而大大减少了数据迁移中带来的这个时间成本和运维成本。



图10 AnalyticDB实现一份数据多场景

应用场景

1、游戏运营分析

游戏领域的竞争非常激烈,在互联网高速增长的同时,流量成本不断升高,市场营销开始往精细化发展。在这样的背景下,需要游戏运营平台实现精细化运营、效果实时反馈,而传统的Hadoop大数据平台存在扩展性繁琐、难用、实时性差、性价比低等问题。

“POLARDB + DTS + ADB大存储+ ADB高性能”产品组合打造出新一代游戏买量市场实时数据运营分析平台,极大的提升了业务体验,促进投放效率转化,同时达到了降低总成本高达300%的理想效果。

充分挖掘数据价值,帮助分析性能产生了5-10倍的提升,极大的提升了业务体验,促进了买量市场的投放效率转化。基于玩家行为日志表日益增长,日增长过亿数据量,通过ADB存储密集型实例进行存储和分析,有效地降低的客户的总体使用成本,总成本下降高达300%



图11 应用场景一:游戏运营分析

2、制造营销

在制造营销的场景中,存在着不同业务数据分析能力低效、多渠道数据汇聚多、运维数据难度高的痛点。

BI+AnalyticDB打造了在离线一体化数据平台,实现了加速销售端数字化转型,解决大量线下成本的效果。



图12 应用场景二:制造营销

3、多模分析、全文检索

原有的数据治理架构存在着数据一致性无法保障、数据冗余存放、性价比低等痛点。通过替换AnalyticDB,达到了大大简化了业务系统架构、大幅降低存储成本、降低计算成本的效果。



图13 应用场景三:多模分析、全文检索

4、企业级数仓

AnalyticDB在企业级数仓中也能发挥极大的作用,以其强大的批处理和多维度复杂分析能力支撑用户包括ETL、CRM和在线分析报表等多种功能,为商家订单管理、仓储管理、分销管理和协同供应链等功能提供有力分析支持,并且基于财务和经营数据,为商家提供快速经营报表、分析、测算工具系统。



图14 应用场景四:企业级数仓

以上就是我今天分享的全部内容,谢谢大家!

更多精彩内容,欢迎大家观看现场视频回放与会议资料

视频回放:https://www.modb.pro/video/6389

会议资料:https://www.modb.pro/doc/61411


欲了解更多可以进入墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。

关注官方公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯

墨天轮访谈 | 阿里云捷熙:AnalyticDB,人人可用的数据分析服务的更多相关文章

  1. 【阿里云产品公测】结构化数据服务OTS之JavaSDK初体验

    [阿里云产品公测]结构化数据服务OTS之JavaSDK初体验 作者:阿里云用户蓝色之鹰 一.OTS简单介绍 OTS 是构建在阿里云飞天分布式系统之上的NoSQL数据库服务,提供海量结构化数据的存储和实 ...

  2. 【阿里云产品公测】高大上的搜索服务OpenSearch,你值得拥有!

    [阿里云产品公测]高大上的搜索服务OpenSearch,你值得拥有! 作者:阿里云用户trcher ​ 一.前言: 在OpenSearch没出来之前,就一直想给网站做个搜索功能,虽然网站本身自带搜索功 ...

  3. 阿里云Quick BI——让人人都成为分析师

    在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家潘炎峰(陌停)对大数据智能分析产品 Quick BI 进行了深入的剖析.大会现场的精彩分享也赢得观众们的一直认可和热烈的反响. Quic ...

  4. 云计算之路-阿里云上:用上了开放缓存服务OCS

    你知道在我们使用的云服务器中哪台最贵吗?跑memcached的缓存服务器(12G内存).你知道保证网站访问速度的功臣之一是谁吗?跑memcached的缓存服务器. 用云服务器这么高贵的内存跑memca ...

  5. 重磅发布!阿里云推PostgreSQL 10 高可用版

    摘要: 近日,阿里云重磅发布PostgreSQL 10 高可用本地SSD盘版,相比原 9.4 版本又新增了JSONB.BRIN索引.GROUPING SETS/CUBE/ROLLUP.UPSERT等多 ...

  6. 用Kolla在阿里云部署10节点高可用OpenStack

    为展现 Kolla 的真正实力,我在阿里云使用 Ansible 自动创建 10 台虚机,部署一套多节点高可用 OpenStack 集群! 前言 上次 Kolla 已经表示了要打 10 个的愿望,这次我 ...

  7. 【初码干货】使用阿里云对Web开发中的资源文件进行CDN加速的深入研究和实践

    提示:阅读本文需提前了解的相关知识 1.阿里云(https://www.aliyun.com) 2.阿里云CDN(https://www.aliyun.com/product/cdn) 3.阿里云OS ...

  8. 基于PHP实现阿里云开放存储服务

    开放存储服务(OpenStorageService,简称OSS),是阿里云对外提供的海量,安全,低成本,高可靠的云存储服务.用户可以通过简单的API(REST方式的接口),在任何时间.任何地点.任何互 ...

  9. 阿里云 OSS+CDN

    https://promotion.aliyun.com/ntms/ossedu2.html https://www.aliyun.com/act/aliyun/ossdoc.html 对象存储(Ob ...

  10. 【阿里云产品公测】云引擎ACE初体验

    作者:阿里云用户蓝色之鹰 :RYYjmG5;  来投票支持我把=i2]qj\  序号2. [阿里云产品公测]云引擎ACE初体验:作者:蓝色之鹰 e(OKE7  序号10.[阿里云产品公测]结构化数据服 ...

随机推荐

  1. docker centos8 java8 mysql8 部署springboot项目

    docker centos8 java8 mysql8 部署springboot项目 一,用idea将springboot项目打成jar包 二,将打的jar包用xshell的rz上传到docker的c ...

  2. 【Mybatis】05 官方文档指北阅读 vol3 配置 其二

    对象工厂(objectFactory)[省略,入门阶段实在不懂] 插件(plugins)[省略,入门阶段实在不懂] 环境配置(environments) MyBatis 可以配置成适应多种环境,这种机 ...

  3. 【Hibernate】Re03 注解方式实现

    使用JPA规范提供的注解即可实现,这样的好处是不需要配置Entity.hbm.xml文件了 但是考虑到多表查询的情况,还是会有xml配置的需要. 一.常用的JPA注解: 1.public @inter ...

  4. 【Vue】07 Webpack Part3 Loader

    Loader是Webpack的核心概念: 除了JS文件以外我们还有CSS,图片,包括一些ES6规范的代码 或者是TypeScript各种前端类型的文件 但是最终必须统一转换成JS文件,Webpack本 ...

  5. 【Zookeeper】02 文件系统 & 监听机制

    官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目, 它主要是用来解决分布式应用中经常遇到的一些数据管理问题, 如:统一命名服务.状态同步服务.集 ...

  6. baselines算法库baselines/bench/monitor.py模块分析

    baselines算法库baselines/bench/monitor.py模块代码: __all__ = ['Monitor', 'get_monitor_files', 'load_results ...

  7. AQS源码深度解析之cancelAcquire方法解读

    1.背景 2.源码解读 调用该方法的地方 方法源码解读 /** * 取消获取资源(异常处理时都需要用到) * 方法主要功能: * 1.处理当前取消节点的状态: * 2.将当前取消节点的前置非取消节点和 ...

  8. Linux系统中目录和文件夹是一个东西吗

    目录和文件夹的区别   在阐述Linux系统的目录前,我们先来回忆一下现实中的目录和文件夹是什么:   在现实中,文件夹(封套)可以用来保存几个文件(或其他项目).而目录则可以用来维护项目的索引,这样 ...

  9. 面试官:说说volatile应用和实现原理?

    volatile 是并发编程中的重要关键字,它的名气甚至是可以与 synchronized.ReentrantLock 等齐名,也是属于并发编程五杰之一. 需要注意的是 volatile 并不能保证原 ...

  10. mysql数据库中decimal数据类型比较大小

    在MySQL中,DECIMAL数据类型用于存储精确的数值,它非常适合用于需要高精度计算的场景,如金融应用.当我们需要在MySQL数据库中比较DECIMAL类型数据的大小时,可以使用标准的比较运算符,如 ...