什么是MaxCompute?

众所周知,MaxCompute是阿里云推出的承载EB级的数据存储能力,百PB级的单日计算能力,公共云覆盖国内外十几个国家和地区,专有云包含城市大脑在内部署超过100+套的阿里巴巴的统一计算平台。官方地址:https://www.aliyun.com/product/odps

MaxCompute是真正为大数据而生的企业级云计算产品,其核心是一项基础服务(PaaS),用于对海量数据进行高性能的分析处理,数据规模越大,计算性能越卓越,在大规模批量计算下性能远超Hadoop Hive,甚至超越了Spark、Impala;

单纯从技术上来看,MaxCompute提供了一个在云端的SQL、MapReduce、Graph服务,提供对海量数据的批量计算能力;

另外,MaxCompute是基于Serverless架构实现的服务,从成本最优化、运维便利性、业务敏捷度三个方面,帮助企业升维核心竞争力;

很多开发者都想试用一下MaxCompute,但又担心这么一款旗舰产品价格不菲,今天小编带大家做一次免费试用;

准备工作

1、提前一周申请10元代金券,代金券申请地址:https://i.aliyun.com/inviteapply?agent_id=183

2、有开发者会问到,10元代金券能干什么?买台最低配置的虚机测试还得上几百元,更别提大数据产品了。首先带大家了解一下MaxCompute计费规则:MaxCompute每月每1GB数据的存储费用是2分钱,每月每处理1GB数据SQL收费0.3元;配套的离线/实时数据同步工具如Datax、Datahub免费,提供大数据开发调度、数据质量、血缘管理的Dataworks也免费。

3、假如你有3G数据,我们看看是如何花费10元;

3.1、3G存储,5张表,每张表平均600M,MaxCompute整体压缩后约1G数据,每天存储开销2分钱;

3.2、从本地上传到MaxCompute,不收费用;

3.3、设置一个Pipeline,每天跑5个SQL

一类SQL是简单查询-单表查询,每次SQL查询开销0.2元

一类SQL是复杂查询-Join 2张表,每次SQL查询开销1.2元;

我们完成上述任务总共需要3.2元,计算方法就是:2次复杂SQL*1.2元+3次简单SQL*0.2+存储0.02分钱;同样任务我们可以通过Dataworks配置周期调度,跑三天,花销9.4元;

4、所以,我们可以通过领用10元代金券,免费完成很多数据任务。

操作流程

开通MaxCompute后付费服务->通过Dataworks创建Project->通过tunnel上传你的数据集->通过SQL运行你的Hello World。

1、开通MaxCompute后付费服务

https://help.aliyun.com/document_detail/58226.html

2、通过Dataworks创建Project

https://help.aliyun.com/document_detail/27815.html

3、通过tunnel上传你的数据集

3.1、安装并配置客户端

https://help.aliyun.com/document_detail/27804.html

3.2、创建表

https://help.aliyun.com/document_detail/27808.html

3.3、导入数据或使用公开数据集

导入数据 https://help.aliyun.com/document_detail/27809.html

使用数据集 https://yq.aliyun.com/articles/89763  注意:有些数据集上T,先通过desc 表名获取数据大小,切勿全表扫描;

4、通过SQL运行你的Hello World

https://help.aliyun.com/document_detail/27810.html

小结

通过免费试用,开发者可以感受到将所有精力都放在业务上,节省了自建平台在学习成本、开发成本、管理成本、投入机房资源和运维成本的总成本,应用开发效率有很大提高。

免费带你体验阿里巴巴旗舰大数据计算产品MaxCompute的更多相关文章

  1. 王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

    如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步. 数据是企业的核心资产,但十年前阿里巴巴的算力已经无 ...

  2. 揭秘阿里云EB级大数据计算引擎MaxCompute

    日前,全球权威咨询与服务机构Forrester发布了<The Forrester WaveTM: Cloud Data Warehouse, Q4 2018>报告.这是Forrester ...

  3. 什么是大数据计算服务MaxCompute

    大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的EB级数据仓库解决方案. 当今社会数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百 ...

  4. 阿里巴巴飞天大数据架构体系与Hadoop生态系统

    很多人问阿里的飞天大数据平台.云梯2.MaxCompute.实时计算到底是什么,和自建Hadoop平台有什么区别. 先说Hadoop 什么是Hadoop? Hadoop是一个开源.高可靠.可扩展的分布 ...

  5. Apache Flink 为什么能够成为新一代大数据计算引擎?

    众所周知,Apache Flink(以下简称 Flink)最早诞生于欧洲,2014 年由其创始团队捐赠给 Apache 基金会.如同其他诞生之初的项目,它新鲜,它开源,它适应了快速转的世界中更重视的速 ...

  6. 大数据计算框架Hadoop, Spark和MPI

    转自:https://www.cnblogs.com/reed/p/7730338.html 今天做题,其中一道是 请简要描述一下Hadoop, Spark, MPI三种计算框架的特点以及分别适用于什 ...

  7. 大数据计算的基石——MapReduce

    MapReduce Google File System提供了大数据存储的方案,这也为后来HDFS提供了理论依据,但是在大数据存储之上的大数据计算则不得不提到MapReduce. 虽然现在通过框架的不 ...

  8. 大数据计算平台Spark内核解读

    1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着 Spark在大数据计算领域的暂露头角,越来越多 ...

  9. 大数据计算:如何仅用1.5KB内存为十亿对象计数

    大数据计算:如何仅用1.5KB内存为十亿对象计数  Big Data Counting: How To Count A Billion Distinct Objects Using Only 1.5K ...

随机推荐

  1. 匈牙利算法实战codevs1022覆盖

    1022 覆盖    时间限制: 1 s  空间限制: 128000 KB  题目等级 : 大师 Master 题解  查看运行结果     题目描述 Description 有一个N×M的单位方格中 ...

  2. 枚举对象中的属性 for . . in

    枚举对象中的属性:把对象中所有的属性和值都取出来 使用 for . . . in 语句 语法: for(var  变量  in  对象){ } for  . . . in 语句  对象中有几个属性,循 ...

  3. linux常用命令-2网络相关命令

    1.ip  [选项]  操作对象{link|addr|route...} ip addr show #显示网卡IP信息 2.修改IP配置 1)     root权限 2)     cd /etc/sy ...

  4. css盒子模型概念

    CSS css盒子模型 又称框模型 (Box Model) ,包含了元素内容(content).内边距(padding).边框(border).外边距(margin)几个要素.如图: 图中最内部的框是 ...

  5. [原创] delphi Memo 滚动到底部/开始 [Delphi XE、Delphi 7]

    以前控制Memo滚动到底部的操作: SendMessage(memo1.Handle,WM_VSCROLL,SB_BOTTOM,0); 或者 Memo1.SelLength:=Length(Memo1 ...

  6. 【锁】Innodb锁

    InnoDB与MyISAM的最大不同有两点:一是支持事务(TRANSACTION):二是采用了行级锁.行级锁与表级锁本来就有许多不同之处,另外,事务的引入也带来了一些新问题.下面我们先介绍一点背景知识 ...

  7. Delphi Xml

    用递归方法,使用 xml 文档生成 Treeview 树形视图.由于是动态生成,所以可以通过修改 xml 的逻辑来定制 Treeview 的结构,从而实现了 xml 对 Treeview 的动态配置, ...

  8. BZOJ 3669: [Noi2014]魔法森林(lct+最小生成树)

    传送门 解题思路 \(lct\)维护最小生成树.我们首先按照\(a\)排序,然后每次加入一条边,在图中维护一棵最小生成树.用并查集判断一下\(1\)与\(n\)是否联通,如果联通的话就尝试更新答案. ...

  9. NX二次开发-UFUN替换组件UF_ASSEM_use_alternate

    NX9+VS2012 #include <uf.h> #include <uf_ui.h> #include <uf_assem.h> #include <u ...

  10. 基于Netty的RPC架构学习笔记(一):NIO

    文章目录 传统的socket分析 举个