pig笔记
1.安装Pig
将pig添加到环境变量当中
2.pig使用
首先将数据库中的数据导入到HDFS上
sqoop import --connect jdbc:mysql://192.168.1.10:3306/cloud --username root --
password JChubby123  --table trade_detail --target-dir '/sqoop/td'
sqoop import --connect jdbc:mysql://192.168.1.10:3306/cloud --username root --
password JChubby123  --table user_info --target-dir '/sqoop/ui'
 
td = load '/sqoop/td' using PigStorage(',') as (id:long, account:chararray, 
income:double, expenses:double, time:chararray);
ui = load '/sqoop/ui' using PigStorage(',') as (id:long, account:chararray, 
name:chararray, age:int);
td1 = foreach td generate account, income, expenses, income-expenses as surplus;
td2 = group td1 by account;
td3 = foreach td2 generate group as account, SUM(td1.income) as income, SUM
(td1.expenses) as expenses, SUM(td1.surplus) as surplus;
tu = join td3 by account, ui by account;
result = foreach tu generate td3::account as account, ui::name, td3::income, 
td3::expenses, td3::surplus;
store result into '/result' using PigStorage(',');
pig笔记的更多相关文章
- pig函数以及关键字 的一些实例应用的总结(来自pig笔记)
		
http://wenku.baidu.com/link?url=yb7KnpSj9nHxWk_MsEVUezvB24evRf9wR87FX0dTT77pGXNXi6k3o_kTmAkBrpIHTqo6 ...
 - Hadoop学习笔记—16.Pig框架学习
		
一.关于Pig:别以为猪不能干活 1.1 Pig的简介 Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换 ...
 - FCC-学习笔记  Pig Latin
		
FCC-学习笔记 Pig Latin 1>最近在学习和练习FCC的题目.这个真的比较的好,推荐给大家. 2>中文版的地址:https://www.freecodecamp.cn/;英文版 ...
 - 大数据笔记(十八)——Pig的自定义函数
		
Pig的自定义函数有三种: 1.自定义过滤函数:相当于where条件 2.自定义运算函数: 3.自定义加载函数:使用load语句加载数据,生成一个bag 默认:一行解析成一个Tuple 需要MR的ja ...
 - 大数据笔记(十七)——Pig的安装及环境配置、数据模型
		
一.Pig简介和Pig的安装配置 1.最早是由Yahoo开发,后来给了Apache 2.支持语言:PigLatin 类似SQL 3.翻译器 PigLatin ---> MapReduce(Spa ...
 - Apache Pig和Solr问题笔记(一)
		
记录下最近两天散仙在工作中遇到的有关Pig0.12.0和Solr4.10.2一些问题,总共有3个,如下: (1)问题一: 如何Pig中使用ASCII和十六进制(hexadecimal)的分隔符进行加载 ...
 - Apache Pig学习笔记(二)
		
主要整理了一下,pig里面的一些关键词的含义和用法,pig虽然是一种以数据流处理为核心的框架,但数据库的大部分关键词和操作,在pig里面基本上都能找到对应的函数,非常灵活与简洁,春节前的最后一篇文章 ...
 - 吴裕雄--天生自然HADOOP操作实验学习笔记:pig简介
		
实验目的 了解pig的该概念和原理 了解pig的思想和用途 了解pig与hadoop的关系 实验原理 1.Pig 相比Java的MapReduce API,Pig为大型数据集的处理提供了更高层次的抽象 ...
 - Hadoop学习笔记系列文章导航
		
一.为何要学习Hadoop? 这是一个信息爆炸的时代.经过数十年的积累,很多企业都聚集了大量的数据.这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急.但数据增长 ...
 
随机推荐
- xshell连接虚拟机CentOS出现eth0 device not found的解决方法
			
昨天用xshell连接虚拟机上的centOS老是连接不上,ifconfig eth0 命令显示 device not found.不知道是什么原因... 折腾了好久 网上是各种搜啊 终于找到解决方法了 ...
 - libev 学习使用
			
libev 简单的I/O库. a high performance full featured event loop written in c libev 的大小也比 libevent 小得多并且自 ...
 - hdu 1224(动态规划 DAG上的最长路)
			
Free DIY Tour Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Tot ...
 - [解决] win7能上网,ubuntu14.04不行
			
更新驱动 http://www.realtek.com.tw/downloads/downloadsView.aspx?Langid=1&PNid=13&PFid=5&Leve ...
 - 2018 ACM-ICPC 沈阳网络赛
			
Problem A Problem B Problem C Problem D Problem E Problem F Problem G Problem H Problem I Problem J ...
 - dutacm.club Water Problem(矩阵快速幂)
			
Water Problem Time Limit:3000/1000 MS (Java/Others) Memory Limit:163840/131072 KB (Java/Others)Tot ...
 - POJ1251 Jungle Roads(Kruskal)(并查集)
			
Jungle Roads Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 23882 Accepted: 11193 De ...
 - 谜题12:ABC
			
这个谜题要问的是一个悦耳的问题,下面的程序将打印什么呢? public class ABC{ public static void main(String[] args){ String letter ...
 - luogu P1126 机器人搬重物
			
题目描述 机器人移动学会(RMI)现在正尝试用机器人搬运物品.机器人的形状是一个直径1.6米的球.在试验阶段,机器人被用于在一个储藏室中搬运货物.储藏室是一个N*M的网格,有些格子为不可移动的障碍.机 ...
 - [BZOJ 1072] 排列perm
			
Link: BZOJ 1072 传送门 Solution: 一道直接next_permutation纯暴力就能过的题? 难道2007年时大家都不知道next_permutation这个函数吗 还是用复 ...