Impala 安装笔记3一impala安装

安装impala之前，确认满足Cloudera Impala Requirements中要求的所有条件：

Supported Operating Systems
Supported CDH Versions
Hive Metastore and Related Configuration
Java Dependencies
Packages and Repositories
Networking Configuration Requirements
Hardware Requirements
User Account Requirements

Impala官方安装wiki地址：

http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_install.html

确保你的包管理工具中加了impala需要的库（在该链接中描述http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_prereqs.html#prereqs）
安装impala各组件的命令：

$ sudo yum install impala             # Binaries for daemons

$ sudo yum install impala-server      # Service start/stop script

$ sudo yum install impala-state-store # Service start/stop script

$ sudo yum install impala-catalog     # Service start/stop script

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf如果没有此文件夹就创建。

　　4. 安装impala-shell

$ sudo yum install impala-shell

　　5. 完成impala要求的配 置。

Post-Installation Configuration for Impala

强制Mandatory配置(Short-Circuit Reads)

开启Block Location Tracking可以允许impala能够从文件系统中直接读取本地数据,而不需要像平常一样与datanode通信,从而可以提升查询的速度。

依据你所安装的CDH的版本不一样，配置也是不一样的，此处我仅整理我对应的CDH4.3正确的配置，实际安装中要采用对应版本的配置。

在所有的impala的节点上，修改hdfs-site.xml文件，添加下列属性：

 <property>

     <name>dfs.client.read.shortcircuit</name>

     <value>true</value>

 </property>

 <property>

 <name>dfs.domain.socket.path</name>

 <value>/var/run/hadoop-hdfs/dn._PORT</value>

 </property>

 <property>

   <name>dfs.client.file-block-storage-locations.timeout</name>

     <value>3000</value>

 </property>

　　2. if /var/run/hadoop-hdfs是组可写的，那么确保他的组是root。

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　4. 上述配置结束后，重启所有datanodes。

强制Mandatory配置(Block Location Tracking)

开启Block Location metadata允许impala知道数据块在哪块磁盘上，这样可以更好的利用下面的磁盘。（如果不开启这个设置，impala默认是不会启动）。

对于每一个Datanode，添加下列属性到hdfs-site.xml 文件：

 <property>

  <name>dfs.datanode.hdfs-blocks-metadata.enabled</name>

  <value>true</value>

</property>

　　2. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　3. 上述配置结束后，重启所有datanodes。

配置impala 启动的一些操作

Impala服务启动的时候会加载/etc/default/impala文件中的配置，这里包含了很多impala要用到的资源的信息。例如，典型的classpath变量，你还需要加入或者修改一些信息，比如statstore的地址信息。

IMPALA_STATE_STORE_HOST=127.0.0.1

IMPALA_STATE_STORE_PORT=24000

IMPALA_BACKEND_PORT=22000

IMPALA_LOG_DIR=/var/log/impala

IMPALA_CATALOG_ARGS=" -log_dir=${IMPALA_LOG_DIR} "

IMPALA_STATE_STORE_ARGS=" -log_dir=${IMPALA_LOG_DIR} -state_store_port=${IMPALA_STATE

_STORE_PORT}"

IMPALA_SERVER_ARGS=" \

    -log_dir=${IMPALA_LOG_DIR} \

    -state_store_port=${IMPALA_STATE_STORE_PORT} \

    -use_statestore \

    -state_store_host=${IMPALA_STATE_STORE_HOST} \

    -be_port=${IMPALA_BACKEND_PORT}"

ENABLE_CORE_DUMPS=false

LIBHDFS_OPTS=-Djava.library.path=/usr/lib/impala/lib

MYSQL_CONNECTOR_JAR=/usr/share/java/mysql-connector-java.jar

IMPALA_BIN=/usr/lib/impala/sbin

IMPALA_HOME=/usr/lib/impala

HIVE_HOME=/home/godp/hive-0.9.0-cdh4.1.0

# HBASE_HOME=/usr/lib/hbase

IMPALA_CONF_DIR=/etc/impala/conf

HADOOP_CONF_DIR=/etc/impala/conf

HIVE_CONF_DIR=/etc/impala/conf

# HBASE_CONF_DIR=/etc/impala/conf

修改完这些信息之后，重启所有impala相关的服务。

$ sudo service impala-server restart

$ sudo service impala-state-store restart

$ sudo service impala-catalog restart

至此，安装结束

Impala 安装笔记3一impala安装的更多相关文章

ubuntu 18.04下greenplum安装笔记（二）安装Greenplum的失败的尝试
之前对Linux环境进行了搭建,现在开始进行Greenplum的正式安装. 下载进Greenplum的官网:https://greenplum.org/download/ 可以发现,对于ubuntu ...
CollabNet Subversion Edge 安装笔记(1)：基本安装设定篇
转载于:http://blog.miniasp.com/post/2011/12/30/CollabNet-Subversion-Edge-Installation-Notes-Part-1-Basi ...
Impala 安装笔记1一Cloudera CDH4.3.0安装
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库 ...
入门大数据---安装ClouderaManager,CDH和Impala,Hue，oozie等服务
1.要求和支持的版本 (PS:我使用的环境,都用加粗标识了.) 1.1 支持的操作系统版本操作系统版本 RHEL/CentOS/OL with RHCK kernel 7.6, 7.5, 7.4, ...
【原创】大数据基础之Impala（1）简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一简介 Apache Impala is the open source, native analytic datab ...
Impala的安装（含使用CM安装和手动安装）（图文详解）
Impala有两种安装方式: 1)使用CM安装Impala 2)手动安装Impala 注意:Impala不支持在Debian/Ubuntu, SuSE, RHEL/CentOS 6.5系统中安装. 基 ...
Impala入门笔记
From:http://tech.uc.cn/?p=817 问题背景: 初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的: 了解Impala ...
CDH6.1.0离线安装——笔记
一. 概述该文档主要记录大数据平台的搭建CDH版的部署过程,以供后续部署环境提供技术参考. 1.1 主流大数据部署方法目前主流的hadoop平台部署方法主要有以下三种: Apache hadoop ...
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记说明以root账户登录Linux操作系统,注意:本文中的所有命令行前面的 #> 表示命令行提示符 ...

随机推荐

poj 2112(二分+网络流)
Optimal Milking Time Limit: 2000MS Memory Limit: 30000K Total Submissions: 15749 Accepted: 5617 ...
AC日记——方格取数洛谷 P1004
题目描述设有N*N的方格图(N<=9),我们将其中的某些方格中填入正整数,而其他的方格中则放人数字0.如下图所示(见样例): A 0 0 0 0 0 0 0 0 0 0 13 0 0 6 0 ...
微信小程序之wx.getLocation()获取地理信息中的小坑
提到wx.getLocation()这个方法,大家都知道是获取地理信息的今天用这个方法获取定位经纬度后传给后台取得附近markers标记集合, 在开发工具上都正常有标记出现 ,但是在手机测试时,死活 ...
lms111，rplidar 方向和起始角
上图中,从X反方向是开始,按顺时针方向增加,实际运转方向也为顺时针方向. lms111:正放时:数据按逆时针依次输出.(起始----->结束) 北阳:正放时:数据按逆时针依次输出
网络数据嗅探工具HexInject
网络数据嗅探工具HexInject 网络数据嗅探是渗透测试工作的重要组成部分.通过嗅探,渗透人员可以了解足够多的内容.极端情况下,只要通过嗅探,就可以完成整个任务,如嗅探到支持网络登录的管理员帐号 ...
一次完整的http请求过程以及网络I/O模型select、epoll
a.一次完整的http请求过程 1.域名解析,得到域名对应的IP; 2.三次握手,客户端与服务器通过socket建立TCP/IP连接; 3.浏览器向服务器发送http请求,如:GET/index.ht ...
基于python脚本的对拍debug
首先,这是python脚本 import os; for i in range(0,20): print ("Case:"+str(i)); print ("random ...
(入门SpringBoot)SpringBoot结合redis(四)
SpringBoot整合redis: 1.引入jar <dependency> <groupId>org.springf ...
maven命令行创建project
创建普通java project: mvn archetype:generate -DgroupId=com.vincent -DartifactId=Java_Project -DpackageNa ...
BT网络中DHT和UPnp的解释（转）
DHT 类似Tracker的根据种子特征码返回种子信息的网络.DHT全称叫分布式哈希表(Distributed Hash Table),是一种分布式存储方法.在不需要服务器的情况下,每个客户端负责一个 ...

Impala 安装笔记3一impala安装

Post-Installation Configuration for Impala

Impala 安装笔记3一impala安装的更多相关文章

随机推荐

热门专题