Pig安装

环境：

hadoop-2.4.1、jdk1.6.0_45、pig-0.12.1

1、下载pig并解压

tar -xzvf pig-0.12.1.tar.gz

2、设置环境变量

export PIG_HOME=~/pig-0.12.1

export PATH=$PATH:$PIG_HOME/bin

3、测试

pig -help

4、说明

1）同一个pig支持多个hadoop版本

2）pig默认通过HADOOP_HOME确定hadoop的版本及安装位置，如果没有HADOOP_HOME环境变量，则pig使用其内置的hadoop版本

3）/bin/pig，可以在这里配置环境变量，比如覆盖全局的HADOOP_HOME

The Pig command script

#

# Environment Variables

#

#     JAVA_HOME                The java implementation to use.    Overrides JAVA_HOME.

#

#     PIG_CLASSPATH Extra Java CLASSPATH entries.

#

#     PIG_USER_CLASSPATH_FIRST If set, add user provided classpath entries to

#                              the top of classpath instead of appending them.

#                              Default is unset, i.e. the classpath entries are

#                              placed normally at the end of a pre-defined classpath.

#

#     HADOOP_HOME/HADOOP_PREFIX     Environment HADOOP_HOME/HADOOP_PREFIX(0.20.205)

#

#     HADOOP_CONF_DIR     Hadoop conf dir

#

#     PIG_HEAPSIZE    The maximum amount of heap to use, in MB.

#                                        Default is 1000.

#

#     PIG_OPTS            Extra Java runtime options.

#

#     PIG_CONF_DIR    Alternate conf dir. Default is ${PIG_HOME}/conf.

#

#     HBASE_HOME       Optionally, the HBase installation directory.

#                      Defaults to ${PIG_HOME}/share/hbase

#

#     HBASE_CONF_DIR - Optionally, the HBase configuration to run against

#                      when using HBaseStorage. Defaults to ${HBASE_HOME}/conf

4）/conf/pig.properties

这里存放一些属性值，在执行pig脚本的时候默认加载。

注意：如果执行pig客户端的用户跟hadoop集群的用户不是一个用户，需要将hdfs上的/tmp目录设置成777权限

hdfs dfs -chmod -R 777 /tmp

Pig安装的更多相关文章

大数据之pig安装
大数据之pig安装 1.下载 pig download 2. 解压安装 mapreduce模式安装: 1:设置HADOOP_HOME,如果pig所在节点不是集群中的节点,那就需要把集群中使用的hado ...
Pig安装及简单使用(pig版本0.13.0,Hadoop版本2.5.0)
原文地址:http://www.linuxidc.com/Linux/2014-03/99055.htm 我们用MapReduce进行数据分析.当业务比较复杂的时候,使用MapReduce将会是一个很 ...
Hadoop:pig 安装及入门示例
pig是hadoop的一个子项目,用于简化MapReduce的开发工作,可以用更人性化的脚本方式分析数据. 一.安装 a) 下载从官网http://pig.apache.org下载最新版本(目前是0 ...
Hadoop之Pig安装
Pig可以看做是Hadoop的客户端软件,使用Pig Latin语言可以实现排序.过滤.求和.分组等操作. Pig的安装步骤: 一.去Pig的官方网站下载.http://pig.apache.org/ ...
Pig安装与应用
1. 参考说明参考文档: http://pig.apache.org/docs/r0.17.0/start.html#build 2. 安装环境说明 2.1. 环境说明 CentOS7.4+ ...
pig安装配置
pig的安装配置很简单,只需要配置一下环境变量和指向hadoop conf的环境变量就行了 1.上传 2.解压 3.配置环境变量 Pig工作模式本地模式:只需要配置PATH环境变量${PIG_HOM ...
阿里云ECS服务器部署HADOOP集群（五）：Pig 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
pig安装配置及实例
一.前提 1. hadoop集群环境配置好(本人hadoop版本:hadoop-2.7.3) 2. windows基础环境准备: jdk环境配置.esclipse环境配置二.搭建pig环境 1.下载 ...
hadoop,hbase,pig安装
注意端口,办公网只能访问8000-9000的端口 pig的一些lib文件版本 /home/map/hadoop/lib下一些98.5的lib没删除

随机推荐

python-在定义函数时，不定长参数中，默认值参数不能放在必选参数前面
如果一个函数的参数中含有默认参数,则这个默认参数后的所有参数都必须是默认参数,否则会报错:SyntaxError: non-default argument follows default argum ...
C++运算符重载三种形式（成员函数，友元函数，普通函数）详解
首先,介绍三种重载方式: //作为成员函数重载(常见) class Person{ Private: string name; int age; public: Person(const char* ...
Explorer内存占用偶尔变高导致卡顿
症状: 打开 "这台电脑",加载缓慢.此时查看任务管理器,explorer内存可能飙升到几G.cpu也很高创建和删除文件缓慢,删除单个文件也会出现进度条.此时查看任务管理器,会出 ...
PHP SNOOPY采集类总结
1.基础教程 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接,表单 fetchlinks fetchform ...
【链表】Swap Nodes in Pairs（三指针）
题目: Given a linked list, swap every two adjacent nodes and return its head. For example,Given 1-> ...
Picasso加载网络图片失败，提示decodestream时返回null
最近遇到一个问题,项目用的图片加载框架是Picasso,网络加载框架是okhttp,项目在加载轮播图时有时可以正常加载,有时,会加载失败,提示decodestream时返回null. 首先,需要确定是 ...
Flow类
JLS参考:https://docs.oracle.com/javase/specs/jls/se7/html/jls-16.html This pass implements dataflow an ...
javascript数组原型方法
1.javascript数组原型方法. <!DOCTYPE html> <html lang="en"> <head> <meta cha ...
ASP.NET Core 中的 ORM 之 Entity Framework
目录 EF Core 简介使用 EF Core(Code First) EF Core 中的一些常用知识点实体建模实体关系种子数据并发管理执行 SQL 语句和存储过程延迟加载和预先加载 ...
spark报错处理
Spark报错处理 1.问题:org.apache.spark.SparkException: Exception thrown in awaitResult 分析:出现这个情况的原因是spark启动 ...