阿里云ODPS <====>蚂蚁大数据
1.命令行客户端工具的安装参考文档:http://repo.aliyun.com/odpscmd/?spm=a2c4g.11186623.2.17.5c185c23zHshCq
2.创建和查看表:https://help.aliyun.com/document_detail/27808.html?spm=a2c4g.11186623.6.567.6a677f32HOWgC5
3.阿里云网页查询工具 dataworks数据工厂 <===============>蚂蚁 [数据智能研发平台(数据工厂)]
CTRL + G
创建表、分区表、上传下载数据、在表下建立分区、向分区表内上传下载数据等操作:
创建分区表:<数据需要在分到不同的文件后上传到分区表中才有作用,上传到分区时必须选择分区>
odps@ sdrtest>create table t_people_p (id int, name string) partitioned by (gender string); \\创建分区,分区以“性别”为分区标致
odps@ sdrtest>alter table t_people_p add if not exists partition (gender='male'); \\创建分区表,分区表的标致为 性别为 “男性”
odps@ sdrtest>tunnel upload men.txt t_people_p/gender='male'; \\将事先整理好的男性的数据上传到建立好的男性的分区表内
通过odpscmd查看到的写入到分区表的数据:
odps@ sdrtest>read t_people_p;
+------------+------------+------------+
| id | name | gender |
+------------+------------+------------+
| 1 | Michael Jordan | male |
| 3 | Bruce Willis | male |
| 5 | Jhon Knight | male |
| 7 | Chiang Kai-shek | male |
| 9 | David Beckham | male |
+------------+------------+------------+
通过上述方式继续上传女性数据到女性分区表:
odps@ sdrtest>alter table t_people_p add if not exists partition (gender='female');
odps@ sdrtest>tunnel upload women.txt t_people_p/gender='female';
通过odpscmd查看到的写入到分区表的数据:
odps@ sdrtest>read t_people_p;
+------------+------------+------------+
| id | name | gender |
+------------+------------+------------+
| 2 | Angela Dorthea Merkel | female |
| 4 | Kim Kardashian | female |
| 6 | Maria Sharapova | female |
| 8 | Jennifer Aniston | female |
| 10 | Dragon Lady | female |
| 1 | Michael Jordan | male |
| 3 | Bruce Willis | male |
| 5 | Jhon Knight | male |
| 7 | Chiang Kai-shek | male |
| 9 | David Beckham | male |
+------------+------------+------------+
odps@ sdrtest> tunnel download t_people_p/gender='male' down_male;
odps@ sdrtest> tunnel download t_people_p/gender='female' down_female; 查看下载的男性分区里面的数据:
[root@sdrtest .odpscmd]# cat down_male
1, Michael Jordan
3, Bruce Willis
5, Jhon Knight
7, Chiang Kai-shek
9, David Beckham
查看下载下来的女性分区内的数据:
[root@sdrtest .odpscmd]# cat down_female
2, Angela Dorthea Merkel
4, Kim Kardashian
6, Maria Sharapova
8, Jennifer Aniston
10, Dragon Lady
阿里云ODPS <====>蚂蚁大数据的更多相关文章
- 揭秘阿里云EB级大数据计算引擎MaxCompute
日前,全球权威咨询与服务机构Forrester发布了<The Forrester WaveTM: Cloud Data Warehouse, Q4 2018>报告.这是Forrester ...
- 阿里云Mysql导入大数据文件
1.查询数据保存为CSV文件 select * from account into outfile '/root/account.csv' fields terminated by ',' enclo ...
- 大数据平台Hive数据迁移至阿里云ODPS平台流程与问题记录
一.背景介绍 最近几天,接到公司的一个将当前大数据平台数据全部迁移到阿里云ODPS平台上的任务.而申请的这个ODPS平台是属于政务内网的,因考虑到安全问题当前的大数据平台与阿里云ODPS的网络是不通的 ...
- Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)
ylbtech-Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次) 1.返回顶部 1. 您好! 很高兴通知您,您已经成功报名将于蚂蚁金服计划在2018年2月28日- 2018年 ...
- Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)- 培训笔记3(机器学习平台)
ylbtech-Train-Alypay-Cloud:蚂蚁大数据平台培训开课通知(第三次)- 培训笔记3(机器学习平台) 机器学习平台 一站式可视化机器学习 https://pai.cloud.ali ...
- 服务器 阿里云服务器Ubuntu挂载数据盘
服务器 阿里云服务器Ubuntu挂载数据盘 转自:http://www.codingyun.com/article/24.html coding云运行在阿里云的Ubuntu 12.04 64位操作系 ...
- Centos7.4(阿里云环境)挂载数据盘
Centos7.4(阿里云环境)挂载数据盘 2018.08.29 10:19 947浏览 查看数据盘 disk -l 磁盘 /dev/vda:42.9 GB, 42949672960 字节,83886 ...
- 阿里云DataWorks实践:数据集成+数据开发
简介 什么是DataWorks: DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成.数据开发.数据地图.数 ...
- 【ODPS】阿里云ODPS中带分区的表操作
1.创建分区表: 分区表有自己的分区列,而分区表则没有. public static void createTableWithPartition(Odps odps, String createTab ...
随机推荐
- 分布式队列celery 异步----Django框架中的使用
仅仅是个人学习的过程,发现有问题欢迎留言 一.celery 介绍 celery是一种功能完备的即插即用的任务对列 celery适用异步处理问题,比如上传邮件.上传文件.图像处理等比较耗时的事情 异步执 ...
- C# 日志记录分级功能使用 按照日期,大小,或是单文件存储
本文将使用一个Nuget的一个组件库来实现一个简单强大的日志记录功能,包采用线程安全实现,所有的记录在后台完成,即使您在前台调用100万次方法,耗时也不过1000ms(具体时间依照电脑性能决定),支持 ...
- s21day06 python笔记
s21day06 python笔记 一.昨日内容回顾及补充 回顾 补充 列表独有功能 reverse:反转 v = [1,2,3,4,5] v.reverse() #[5,4,3,2,1] sort: ...
- h5 网络断网时,返回上一个页面 demo (与检测网络代码相结合,更直观看到结果)
页面一: <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8& ...
- memcache 应用场景
一..memcache应用场景 1.应用场景一: 缓解数据库压力,提高交互速度.它的一个总原则是将经常需要从数据库读取的数据缓存在memcached中.这些数据也分为几类: (1).经常被读取并且实时 ...
- 学习笔记TF050:TensorFlow源代码解析
TensorFlow目录结构. ACKNOWLEDGMENTS #TensorFlow版本声明 ADOPTERS.md #使用TensorFlow的人员或组织列表 AUTHORS #TensorFlo ...
- AJAX 请求后使用 JS 打开新标签页被阻止的解决方法
需求:发起一个 AJAX 请求,根据请求结果来打开一个新页面. 问题:AJAX 请求后,使用 window.open() 方法来打开新页面会被浏览器阻止. 解决方法:在 AJAX 请求之前,就使用 c ...
- 使用samba或NFS实现文件共享
- 解决 windows下安装Anaconda后python pip不可用的情况
在windows系统下通过安装Anaconda的方式安装的python使用中发现不能再通过pip安装python包.只能通过conda install packname 的方法,导致很多conda不支 ...
- Pytho, struct处理二进制(pack和unpack)
[转]Python使用struct处理二进制(pack和unpack用法) Leave a reply 转载自:http://www.cnblogs.com/gala/archive/2011/09/ ...