Impala 安装笔记3一impala安装

安装impala之前，确认满足Cloudera Impala Requirements中要求的所有条件：

Supported Operating Systems
Supported CDH Versions
Hive Metastore and Related Configuration
Java Dependencies
Packages and Repositories
Networking Configuration Requirements
Hardware Requirements
User Account Requirements

Impala官方安装wiki地址：

http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_install.html

确保你的包管理工具中加了impala需要的库（在该链接中描述http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_prereqs.html#prereqs）
安装impala各组件的命令：

$ sudo yum install impala             # Binaries for daemons

$ sudo yum install impala-server      # Service start/stop script

$ sudo yum install impala-state-store # Service start/stop script

$ sudo yum install impala-catalog     # Service start/stop script

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf如果没有此文件夹就创建。

　　4. 安装impala-shell

$ sudo yum install impala-shell

　　5. 完成impala要求的配 置。

Post-Installation Configuration for Impala

强制Mandatory配置(Short-Circuit Reads)

开启Block Location Tracking可以允许impala能够从文件系统中直接读取本地数据,而不需要像平常一样与datanode通信,从而可以提升查询的速度。

依据你所安装的CDH的版本不一样，配置也是不一样的，此处我仅整理我对应的CDH4.3正确的配置，实际安装中要采用对应版本的配置。

在所有的impala的节点上，修改hdfs-site.xml文件，添加下列属性：

 <property>

     <name>dfs.client.read.shortcircuit</name>

     <value>true</value>

 </property>

 <property>

 <name>dfs.domain.socket.path</name>

 <value>/var/run/hadoop-hdfs/dn._PORT</value>

 </property>

 <property>

   <name>dfs.client.file-block-storage-locations.timeout</name>

     <value>3000</value>

 </property>

　　2. if /var/run/hadoop-hdfs是组可写的，那么确保他的组是root。

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　4. 上述配置结束后，重启所有datanodes。

强制Mandatory配置(Block Location Tracking)

开启Block Location metadata允许impala知道数据块在哪块磁盘上，这样可以更好的利用下面的磁盘。（如果不开启这个设置，impala默认是不会启动）。

对于每一个Datanode，添加下列属性到hdfs-site.xml 文件：

 <property>

  <name>dfs.datanode.hdfs-blocks-metadata.enabled</name>

  <value>true</value>

</property>

　　2. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　3. 上述配置结束后，重启所有datanodes。

配置impala 启动的一些操作

Impala服务启动的时候会加载/etc/default/impala文件中的配置，这里包含了很多impala要用到的资源的信息。例如，典型的classpath变量，你还需要加入或者修改一些信息，比如statstore的地址信息。

IMPALA_STATE_STORE_HOST=127.0.0.1

IMPALA_STATE_STORE_PORT=24000

IMPALA_BACKEND_PORT=22000

IMPALA_LOG_DIR=/var/log/impala

IMPALA_CATALOG_ARGS=" -log_dir=${IMPALA_LOG_DIR} "

IMPALA_STATE_STORE_ARGS=" -log_dir=${IMPALA_LOG_DIR} -state_store_port=${IMPALA_STATE

_STORE_PORT}"

IMPALA_SERVER_ARGS=" \

    -log_dir=${IMPALA_LOG_DIR} \

    -state_store_port=${IMPALA_STATE_STORE_PORT} \

    -use_statestore \

    -state_store_host=${IMPALA_STATE_STORE_HOST} \

    -be_port=${IMPALA_BACKEND_PORT}"

ENABLE_CORE_DUMPS=false

LIBHDFS_OPTS=-Djava.library.path=/usr/lib/impala/lib

MYSQL_CONNECTOR_JAR=/usr/share/java/mysql-connector-java.jar

IMPALA_BIN=/usr/lib/impala/sbin

IMPALA_HOME=/usr/lib/impala

HIVE_HOME=/home/godp/hive-0.9.0-cdh4.1.0

# HBASE_HOME=/usr/lib/hbase

IMPALA_CONF_DIR=/etc/impala/conf

HADOOP_CONF_DIR=/etc/impala/conf

HIVE_CONF_DIR=/etc/impala/conf

# HBASE_CONF_DIR=/etc/impala/conf

修改完这些信息之后，重启所有impala相关的服务。

$ sudo service impala-server restart

$ sudo service impala-state-store restart

$ sudo service impala-catalog restart

至此，安装结束

Impala 安装笔记3一impala安装的更多相关文章

ubuntu 18.04下greenplum安装笔记（二）安装Greenplum的失败的尝试
之前对Linux环境进行了搭建,现在开始进行Greenplum的正式安装. 下载进Greenplum的官网:https://greenplum.org/download/ 可以发现,对于ubuntu ...
CollabNet Subversion Edge 安装笔记(1)：基本安装设定篇
转载于:http://blog.miniasp.com/post/2011/12/30/CollabNet-Subversion-Edge-Installation-Notes-Part-1-Basi ...
Impala 安装笔记1一Cloudera CDH4.3.0安装
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库 ...
入门大数据---安装ClouderaManager,CDH和Impala,Hue，oozie等服务
1.要求和支持的版本 (PS:我使用的环境,都用加粗标识了.) 1.1 支持的操作系统版本操作系统版本 RHEL/CentOS/OL with RHCK kernel 7.6, 7.5, 7.4, ...
【原创】大数据基础之Impala（1）简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一简介 Apache Impala is the open source, native analytic datab ...
Impala的安装（含使用CM安装和手动安装）（图文详解）
Impala有两种安装方式: 1)使用CM安装Impala 2)手动安装Impala 注意:Impala不支持在Debian/Ubuntu, SuSE, RHEL/CentOS 6.5系统中安装. 基 ...
Impala入门笔记
From:http://tech.uc.cn/?p=817 问题背景: 初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的: 了解Impala ...
CDH6.1.0离线安装——笔记
一. 概述该文档主要记录大数据平台的搭建CDH版的部署过程,以供后续部署环境提供技术参考. 1.1 主流大数据部署方法目前主流的hadoop平台部署方法主要有以下三种: Apache hadoop ...
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记说明以root账户登录Linux操作系统,注意:本文中的所有命令行前面的 #> 表示命令行提示符 ...

随机推荐

php解析json字符串变量总是空白null
通过接口获取的json字符串使用json_decode始终无法正确解析,返回空白. 直接把结果字符串复制出来手动创建一个变量却正常,在前端js也能解析,搞了半天不得其解,最后发现是接口输出的结果包含有 ...
微信小程序之wx.getLocation()获取地理信息中的小坑
提到wx.getLocation()这个方法,大家都知道是获取地理信息的今天用这个方法获取定位经纬度后传给后台取得附近markers标记集合, 在开发工具上都正常有标记出现 ,但是在手机测试时,死活 ...
Java 内存查看与分析
1:gc日志输出在jvm启动参数中加入 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimestamps -XX:+PrintGCApplication ...
利用github搭建个人网站
1.注册一个github https://github.com/ 2.新建一个仓库仓库名用 Owner.github.io 的格式,然后点击创建 3.源码上传至github 安装github桌 ...
Codeforces 558E A Simple Task（权值线段树）
题目链接 A Simple Task 题意给出一个小写字母序列和若干操作.每个操作为对给定区间进行升序排序或降序排序. 考虑权值线段树. 建立26棵权值线段树.每次操作的时候先把26棵线段树上的 ...
BZOJ 1044 木棍分割（二分答案 + DP优化）
题目链接木棍分割 1044: [HAOI2008]木棍分割 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 3830 Solved: 1453[S ...
Thread线程的基础知识及常见疑惑点
引言相信各位道友在平时工作中已经很少直接用到Thread线程类了,现在大多是通过线程池或者一些多线程框架来操作线程任务,但我觉得还是有必要了解清楚Thread线程类中各种方法的含义,了解了底层才能更 ...
luogu P2831 愤怒的小鸟
题目描述 Kiana最近沉迷于一款神奇的游戏无法自拔. 简单来说,这款游戏是在一个平面上进行的. 有一架弹弓位于(0,0)处,每次Kiana可以用它向第一象限发射一只红色的小鸟,小鸟们的飞行轨迹均为形 ...
Hdoj 3506 Monkey Party
Discription Far away from our world, there is a banana forest. And many lovely monkeys live there. O ...
1005 Spell It Right
1005 Spell It Right Given a non-negative integer N, your task is to compute the sum of all the dig ...

Impala 安装笔记3一impala安装

Post-Installation Configuration for Impala

Impala 安装笔记3一impala安装的更多相关文章

随机推荐

热门专题