配置hadoop集群的lzo压缩

1). 配置前的环境准备

# yum -y install  lzo-devel zlib-devel  gcc autoconf automakelibtool

2). (all) 在集群的所有节点上安装Lzo库

　下载、解压，然后编译。并将/usr/local/hadoop/lzo-2.06目录下的所有文件打包，并同步到集群中的所有机器上。相关命令：

 # tar -zxvf lzo-2.06.tar.gz

 # cd lzo-2.06

 # export CFLAGS=-m64

 # ./configure --enable-shared

 # make

 # make install

3). Lzo库文件被默认安装到了/usr/local/lib，我们需要进一步指定lzo库文件的路径。两个方法：
　3.1. 拷贝/usr/local/lib目录下的lzo库文件到/usr/lib(32位平台)，或/usr/lib64(64位平台)

#cp /usr/local/lib/liblzo2.* /usr/lib64

　3.2. 在/etc/ld.so.conf.d/目录下新建lzo.conf文件，写入lzo库文件的路径，然后运行/sbin/ldconfig -v，使配置生效

#vi /etc/ld.so.conf.d/lzo.conf

  /usr/local/lib

# /sbin/ldconfig -v

4). 编译安装Hadoop Lzo本地库以及Jar包
　

　采用twitter的下载地址，解压文件

unzip hadoop-lzo-master.zip

　4.1.修改 pom.xml 文件，即hadoop的当前版本

<properties>

    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>

    <hadoop.current.version>2.2.0</hadoop.current.version>

    <hadoop.old.version>1.0.4</hadoop.old.version>

</properties>

　4.2.hadoop-lzo-master.zip文件相关操作

cd hadoop-lzo-master

export CFLAGS=-m64

export CXXFLAGS=-m64

export C_INCLUDE_PATH=/usr/local/include/lzo

export LIBRARY_PATH=/usr/local/lib 
//预先安装好maven

mvn clean package -Dmaven.test.skip=true

　4.3.把target/native/Linux-amd64-64/lib下的全部文件拷贝到${HADOOP_HOME}/lib/native

[root@ncst target]# cd native/Linux-amd64-64
[root@ncst Linux-amd64-64]# tar -cBf - -C lib . | tar -xBvf - -C ~
[root@ncst ~]# cp ~/libgplcompression* $HADOOP_HOME/lib/native/

　4.4.然后拷贝JAR包

cp hadoop-lzo-master/target/hadoop-lzo-0.4.-SNAPSHOT.jar /opt/hadoop-2.2./share/hadoop/common/lib

5). 对于Hbase启用Lzo

cp $HADOOP_HOME/lib/native/Linux-amd64-64/* $HBASE_HOME/lib/native/Linux-amd64-64

　5.1.修改：hbase-env.sh

exportHBASE_LIBRARY_PATH=$HBASE_LIBRARY_PATH:$HBASE_HOME/lib/native/Linux-amd64-/:/usr/local/lib/

6). 修改配置文件

　6.1.在hadoop-env.sh中加入

export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native

　6.2.在core-site.xml

<!-- 配置 Hadoop压缩包 -->

<property>

    <name>io.compression.codecs</name>

    <value>org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>

</property>

<property>

    <name>io.compression.codec.lzo.class</name>

    <value>com.hadoop.compression.lzo.LzoCodec</value>

</property>

　6.3.在mapred-site.xml

<property>

    <name>mapreduce.map.output.compress</name>

    <value>true</value>

</property> 

<property>

    <name>mapreduce.map.output.compress.codec</name>

    <value>com.hadoop.compression.lzo.LzoCodec</value>

</property> 

<property>

     <name>mapred.child.env</name>

     <value>LD_LIBRARY_PATH=/usr/local/lib</value>

</property>

7). 安装lzop

Lzop是使用lzo库写的一个程序，通过shell命令直接可以压缩、解压缩文件。下载地址

tar zxvf lzop-1.03.tar.gz

cd lzop-1.03

#  exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib

# ./configure

#  make

#  makeinstall

配置hadoop集群的lzo压缩的更多相关文章

开启hadoop和Hbase集群的lzo压缩功能（转）
原文链接:开启hadoop和Hbase集群的lzo压缩功能问题导读: 1.如何启动hadoop.hbase集群的压缩功能? 2.lzo的作用是什么? 3.hadoop配置文件需要做哪些修改? 首先我 ...
Linux中安装配置hadoop集群
一. 简介参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把详细的安装步骤叙述一下.我所使用的环境:两台ubuntu 14.04 64位的台式机,hadoop选择 ...
在 Linux 服务器上搭建和配置 Hadoop 集群
实验条件:3台centos服务器,jdk版本1.8.0,Hadoop 版本2.8.0 注:hadoop安装和搭建过程中都是在用户lb的home目录下,master的主机名为host98,slave的主 ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
centos7配置hadoop集群
一:测试环境搭建规划: 主机名称 IP 用户 HDFS YARN hadoop11 192.168.1.101 hadoop NameNode,DataNode NodeManager hadoop1 ...
安装和配置hadoop集群步骤
hadoop集群的安装步骤和配置 hadoop是由java语言编写的,首先我们肯定要在电脑中安装jdk,配置好jdk的环境,接下来就是安装hadoop集群的步骤了,在安装之前需要创建hadoop用户组 ...
linux配置hadoop集群
①安装虚拟机 ②为虚拟机添加共享文件右击已经安装好的虚拟机设置—>选项—>共享文件 ③配置映射 sudo nano /etc/network/interfaces 重启网络:sud ...
为Linux集群创建新账户，并配置hadoop集群
转自:http://blog.csdn.net/bluesky8640/article/details/6945776 之前装python.jdk.hadoop都是用的root账户,这是一个绝对的失策 ...
配置hadoop集群一
花了1天时间最终把环境搭建好了.整理了一下,希望对想学习hadoop的有所帮助. 资料下载:http://pan.baidu.com/s/1kTupgkn 包括了linux虚拟机.jdk, hadoo ...

随机推荐

Spring Security OAuth2 源码分析
Spring Security OAuth2 主要两部分功能:1.生成token,2.验证token,最大概的流程进行了一次梳理 1.Server端生成token (post /oauth/token ...
170413、怎么精确理解leader布置的任务（技术外的话）
[缘起] 和一个同学交代了一个很重要的事情,结果执行的结果并不是自己想要的,微微生气之余,简单的聊聊“如何精确的理解leader布置的任务”. [员工角度的潜在困惑] 1)leader讲了很多,脑子记 ...
CentOS源码安装QT
在VirtualBox上的CentOS下安装qt-everywhere-opensource-src-4.8.4 ,执行 ./confiure时失败,失败信息为:Basic XLib function ...
ora-04021 无法锁表的解决办法
案例场景: 备库上有一张分区表,在做数据导入出了点问题,需要truncate掉重新导入,在执行truncate table时发生了04021错误. 错误分析: ora-04021的解释是等待锁定对象时 ...
前端开发 - JavaScript - 总结
一.JavaScript的特征 javaScript是一种web前端的描述语言,也是一种基于对象(object)和事件驱动(Event Driven)的.安全性好的脚本语言.它运行在客户端从而减轻服务 ...
Java 之 JUC
1. JUC 简介在 Java 5.0 提供了 java.util.concurrent(简称JUC)包,在此包中增加了在并发编程中很常用的工具类, 用于定义类似于线程的自定义子系统,包括线程池,异 ...
如何在python项目中写出像Django中一样功能的settings
一核心文件目录结构二实现代码 resdme: 在实现此功能主要用到的知识点及模块: 1.反射 3.内置方法dir # 全局配置 NAME = 'root' # 用户配置 NAME = 'pe ...
Pycharm配置同步服务器
一.使用场景我们一般需要将代码放到服务器上运行,但如果等我们将项目全部开发好之后再上传到服务器,而且每次在开发阶段需要经过多次修改,每修改一次,都手动上传一次,这样就太麻烦了,有没有一种方法可以达到 ...
通过EditText的setTransformationMethod()隐藏或显示密码
private Button mBtnPassword; private EditText mEtPassword; private boolean mbDisplayFlg = false; /** ...
重新编写equals()方法，hashCode()方法，以及toString()，提供自定义的相等标准，以及自描述方法
下面给出一个实例,重新编写equals()方法,提供自定义的相等标准 public class PersonTest { public static void main(String[] args) ...

配置hadoop集群的lzo压缩

配置hadoop集群的lzo压缩的更多相关文章

随机推荐

热门专题