基于Cloudera Manager5配置HIVE压缩

[Author]: kwu

基于Cloudera Manager5配置HIVE压缩，配置HIVE的压缩。实际就是配置MapReduce的压缩，包含执行结果及中间结果的压缩。

1、基于HIVE命令行的配置

set hive.enforce.bucketing=true;

set hive.exec.compress.output=true;

set mapred.output.compress=true;

set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec;

在hive的命令下行执行如上代码就可以，这里用的是Gzip压缩。

2、基于xml文件的压缩配置

mapred-site.xml

<property>

  <name>mapred.output.compress</name>

  <value>true</value>

  <description>Should the job outputs be compressed?

  </description>

</property>

<property>

  <name>mapred.output.compression.codec</name>

  <value>org.apache.hadoop.io.compress.GzipCodec</value>

  <description>If the job outputs are compressed, how should they be compressed?

  </description>

</property>

hive-site.xml

<property>

  <name>hive.enforce.bucketing</name>

  <value>true</value>

</property>

<property>

  <name>hive.exec.compress.output</name>

  <value>true</value>

</property>

<property>

  <name>io.compression.codecs</name>

  <value>org.apache.hadoop.io.compress.GzipCodec</value>

</property>

3、基于Cloudera Manager5配置HIVE压缩

1) 基于yarn的MR配置

2) hive的配置

添加例如以下内容

<property>

  <name>hive.enforce.bucketing</name>

  <value>true</value>

</property>

<property>

  <name>hive.exec.compress.output</name>

  <value>true</value>

</property>

<property>

  <name>io.compression.codecs</name>

  <value>org.apache.hadoop.io.compress.GzipCodec</value>

</property>

配置完成，MapReduce包含hive执行结果以GZip进行压缩。

基于Cloudera Manager5配置HIVE压缩的更多相关文章

Hadoop生态圈-基于yum源的方式部署Cloudera Manager5.15.1
Hadoop生态圈-基于yum源的方式部署Cloudera Manager5.15.1 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 我之前分享过关于离线方式部署Cloudera ...
Hive| 压缩| 存储| 调优
Hadoop压缩配置修改Hadoop集群具有Snappy压缩方式: 查看hadoop支持的压缩方式 [kris@hadoop101 datas]$ hadoop checknative 将编译好的支 ...
使用Cloudera Manager搭建Hive服务
使用Cloudera Manager搭建Hive服务作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.安装Hive环境 1>.进入CM服务安装向导 2>.选择需要 ...
基于Docker搭建Hadoop+Hive
为配合生产hadoop使用,在本地搭建测试环境,使用docker环境实现(主要是省事~),拉取阿里云已有hadoop镜像基础上,安装hive组件,参考下面两个专栏文章: 克里斯:基于 Docker 构 ...
SQL Standard Based Hive Authorization（基于SQL标准的Hive授权）
说明:该文档翻译/整理于Hive官方文档https://cwiki.apache.org/confluence/display/Hive/SQL+Standard+Based+Hive+Authori ...
hive 压缩全解读(hive表存储格式以及外部表直接加载压缩格式数据)；HADOOP存储数据压缩方案对比（LZO,gz，ORC）
数据做压缩和解压缩会增加CPU的开销,但可以最大程度的减少文件所需的磁盘空间和网络I/O的开销,所以最好对那些I/O密集型的作业使用数据压缩,cpu密集型,使用压缩反而会降低性能. 而hive中间结果 ...
WebSphere下配置HTTP压缩
WebSphere下配置HTTP压缩背景 WebSphere本身的安装配置中并不包含HTTP压缩的模块,而是通过新增WebServer来实现的,WebSphere通过Plugin与WebServer ...
Hadoop生态圈-离线方式部署Cloudera Manager5.15.1
Hadoop生态圈-离线方式部署Cloudera Manager5.15.1 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 到目前位置,Cloudera Manager和CDH最新 ...
CM记录-配置Hive on Spark
默认hive on spark是禁用的,需要在Cloudera Manager中启用.1.登录CM界面,打开hive服务.2.单击配置标签,查找enable hive on spark属性.3.勾选 ...

随机推荐

《暗黑世界GM管理后台系统》部署+功能说明
原地址:http://blog.csdn.net/uxqclm/article/details/11969761 欢迎来到9秒:www.9miao.com 暗黑三国管理后台说明文档 (一)功能描述该后 ...
SQL Union和SQL Union All用法
SQL UNION 操作符 UNION 操作符用于合并两个或多个 SELECT 语句的结果集. 请注意,UNION 内部的 SELECT 语句必须拥有相同数量的列.列也必须拥有相似的数据类型.同时,每 ...
[jobdu]不用加减乘除做加法
使用异或和与,模拟机器的加法.http://blog.csdn.net/htyurencaotang/article/details/11125415 #include <iostream> ...
Java多态的体现之继承
/** * * 功能:演示多态 */ package com.litao; public class Demo5 { public static void main(String[] args) { ...
【HDOJ】1253 胜利大逃亡
经典的BFS,需要注意的是当前时间超过最小时间,输出-1.同时,队列为空时还未返回,证明并未找到终点(可能终点为墙).此时也应该输出-1,这个部分容易wa. #include <cstdio&g ...
【HDOJ】1222 Wolf and Rabbit
最大公约数,辗转相除. #include <stdio.h> long long gcd(long long a, long long b) { if (a<b) return gc ...
bzoj1007
其实吧,就是一个半平面交,而且不用考虑转回来的情况,所以只要极角排序然后用栈即可给的是点斜式,比极角很方便至于完整版的半平面交还没写过,看到再说吧 ..] of longint; v:..] of b ...
$resource
属性/URL映射 AngularJS Resource:与 RESTful API 交互自定义$resource方法 <!DOCTYPE html> <html ng-app=&q ...
-_-#【JS 优化】把 JS 放到底部
一开始为以为Javascript脚本尽量放到页面底部加载,是指所有的JS脚本都要放到底部,后来才发现, 并不完全是这样,这里所指的脚本是指那些在加载过程中要执行的脚本,所以一般的处理办法还是页面头部引 ...
【转】VS2010/MFC编程入门之八（对话框：创建对话框类和添加控件变量）
原文网址:http://www.jizhuomi.com/software/153.html 前两讲中鸡啄米为大家讲解了如何创建对话框资源.创建好对话框资源后要做的就是生成对话框类了.鸡啄米再声明下, ...

基于Cloudera Manager5配置HIVE压缩

基于Cloudera Manager5配置HIVE压缩的更多相关文章

随机推荐

热门专题