1.命令行客户端工具的安装参考文档:http://repo.aliyun.com/odpscmd/?spm=a2c4g.11186623.2.17.5c185c23zHshCq

2.创建和查看表:https://help.aliyun.com/document_detail/27808.html?spm=a2c4g.11186623.6.567.6a677f32HOWgC5

3.阿里云网页查询工具 dataworks数据工厂 <===============>蚂蚁 [数据智能研发平台(数据工厂)]

 CTRL + G

创建表、分区表、上传下载数据、在表下建立分区、向分区表内上传下载数据等操作:

创建分区表:<数据需要在分到不同的文件后上传到分区表中才有作用,上传到分区时必须选择分区>

odps@ sdrtest>create table t_people_p (id int, name string) partitioned by (gender string); \\创建分区,分区以“性别”为分区标致
odps@ sdrtest>alter table t_people_p add if not exists partition (gender='male'); \\创建分区表,分区表的标致为 性别为 “男性”
odps@ sdrtest>tunnel upload men.txt t_people_p/gender='male'; \\将事先整理好的男性的数据上传到建立好的男性的分区表内
通过odpscmd查看到的写入到分区表的数据:
odps@ sdrtest>read t_people_p;
+------------+------------+------------+
| id | name | gender |
+------------+------------+------------+
| 1 | Michael Jordan | male |
| 3 | Bruce Willis | male |
| 5 | Jhon Knight | male |
| 7 | Chiang Kai-shek | male |
| 9 | David Beckham | male |
+------------+------------+------------+

通过上述方式继续上传女性数据到女性分区表:

odps@ sdrtest>alter table t_people_p add if not exists partition (gender='female');
odps@ sdrtest>tunnel upload women.txt t_people_p/gender='female';
通过odpscmd查看到的写入到分区表的数据:
odps@ sdrtest>read t_people_p;
+------------+------------+------------+
| id | name | gender |
+------------+------------+------------+
| 2 | Angela Dorthea Merkel | female |
| 4 | Kim Kardashian | female |
| 6 | Maria Sharapova | female |
| 8 | Jennifer Aniston | female |
| 10 | Dragon Lady | female |
| 1 | Michael Jordan | male |
| 3 | Bruce Willis | male |
| 5 | Jhon Knight | male |
| 7 | Chiang Kai-shek | male |
| 9 | David Beckham | male |
+------------+------------+------------+

  

odps@ sdrtest> tunnel download t_people_p/gender='male' down_male;
odps@ sdrtest> tunnel download t_people_p/gender='female' down_female; 查看下载的男性分区里面的数据:
[root@sdrtest .odpscmd]# cat down_male
1, Michael Jordan
3, Bruce Willis
5, Jhon Knight
7, Chiang Kai-shek
9, David Beckham
查看下载下来的女性分区内的数据:
[root@sdrtest .odpscmd]# cat down_female
2, Angela Dorthea Merkel
4, Kim Kardashian
6, Maria Sharapova
8, Jennifer Aniston
10, Dragon Lady

  

  

阿里云ODPS <====>蚂蚁大数据的更多相关文章

  1. 揭秘阿里云EB级大数据计算引擎MaxCompute

    日前,全球权威咨询与服务机构Forrester发布了<The Forrester WaveTM: Cloud Data Warehouse, Q4 2018>报告.这是Forrester ...

  2. 阿里云Mysql导入大数据文件

    1.查询数据保存为CSV文件 select * from account into outfile '/root/account.csv' fields terminated by ',' enclo ...

  3. 大数据平台Hive数据迁移至阿里云ODPS平台流程与问题记录

    一.背景介绍 最近几天,接到公司的一个将当前大数据平台数据全部迁移到阿里云ODPS平台上的任务.而申请的这个ODPS平台是属于政务内网的,因考虑到安全问题当前的大数据平台与阿里云ODPS的网络是不通的 ...

  4. Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)

    ylbtech-Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次) 1.返回顶部 1. 您好! 很高兴通知您,您已经成功报名将于蚂蚁金服计划在2018年2月28日- 2018年 ...

  5. Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)- 培训笔记3(机器学习平台)

    ylbtech-Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)- 培训笔记3(机器学习平台) 机器学习平台 一站式可视化机器学习 https://pai.cloud.ali ...

  6. 服务器 阿里云服务器Ubuntu挂载数据盘

    服务器 阿里云服务器Ubuntu挂载数据盘  转自:http://www.codingyun.com/article/24.html coding云运行在阿里云的Ubuntu 12.04 64位操作系 ...

  7. Centos7.4(阿里云环境)挂载数据盘

    Centos7.4(阿里云环境)挂载数据盘 2018.08.29 10:19 947浏览 查看数据盘 disk -l 磁盘 /dev/vda:42.9 GB, 42949672960 字节,83886 ...

  8. 阿里云DataWorks实践:数据集成+数据开发

    简介 什么是DataWorks: DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成.数据开发.数据地图.数 ...

  9. 【ODPS】阿里云ODPS中带分区的表操作

    1.创建分区表: 分区表有自己的分区列,而分区表则没有. public static void createTableWithPartition(Odps odps, String createTab ...

随机推荐

  1. Cordova编译报AAPT错误的解决方法

    因为项目中同时使用cordova-hot-code-push-plugin和phonegap-plugin-barcodescanner,编译时报错:AAPT: error: resource and ...

  2. find语法

    语法 find path -option [ -print ] [ -exec -ok command ] {} \; 参数说明 : find 根据下列规则判断 path 和 expression,在 ...

  3. Tex_Err:缺失wlscirep.cls

    使用期刊模板编译时,需要'.cls'一类格式文件支持.从Overleaf上直接Copy代码到本地,发现自己的tex运行时会报错: ! LaTeX Error: File `wlscirep.cls' ...

  4. day 07 元组,字典和集合等数据类型介绍

    元组:就是一个不可变的列表 1.用途,当我们需要记录多个值,并且没有更改的需求的时候,应该使用元组 2定义方式:使用,在 ( ) 中分隔开多个任意类型的值 注:t=("egg",) ...

  5. Qthread的使用方法

    1:重载 run()函数 2:将对象移到Qthread对象中 Movetothread 该方法必须通过信号 -槽来激发.

  6. Flink实战(1) - Apache Flink安装和示例程序的执行

    在Windows上安装 从官方网站下载需要的二进制包 比如我下载的是flink-1.2.0-bin-hadoop2-scala_2.10.tgz,解压后进入bin目录 可以执行bat文件,也可以使用c ...

  7. CCF-再卖菜-20180904

    可以说这道题出的不错,我是用动态规划做的 ( 严谨点说应该是记忆化搜索,我是递归版本,非递归我不会啊... 题意分析: x1  x2  x3 已知 x1+x2=t1或t1+1 x1+x2+x3=t2 ...

  8. python txt文件常用读写操作

    文件的打开的两种方式 f = open("data.txt","r") #设置文件对象 f.close() #关闭文件 #为了方便,避免忘记close掉这个文件 ...

  9. python 3.5 import theano ::hypot error

    # win10 , mingw(nuwen,g++ 6.3), python 3.5 , 描述: import theano 时生成动态的 mod.cpp ,然后编译库的时候报 ::hypot 未定义 ...

  10. Restful Service 中 DateTime 在 url 中传递

    在C# url 中一旦包特殊字符,请求可能就无法送达.可以使用如下方法,最为便捷. 请求端: beginTime.Value.ToString("yyyyMMddHHmmss") ...