新手安装 hadoop、hive和hbase 笔记

系统是ubuntu 12.04 ， hadoop版本是1.2.1 ， hive版本是0.12 ， hbase版本我忘记了，不好意思
首先是配置好hostname
vi /etc/hosts
写入你要配置的ip 和它的hostname
这里我写入了
192.168.19.129 ubuntu

给要部署hadoop的机器都互相配置信任关系，具体怎么玩，自己谷歌
测试一下ssh user@hostname ，做到无需输入密码即可登录

给所有需要配置hadoop集群的机器，关闭防火墙
service iptables stop

(下面的hadoop版本是1.2.1 , hive版本是0.12 , hbase版本是0.94.12)
修改$HADOOP_HOME/conf/hadoop-env.sh文件
搜索JAVA_HOME
将前面的#去掉，取消注释
写入你的JAVA_HOME路径(方式是在shell上执行：echo $JAVA_HOME , 如果为空,那么你就自己再配置一下JDK吧，囧)

修改$HADOOP_HOME/conf/core-site.xml文件
在<configuration></configuration>之间加入

<property>

   <name>fs.default.name</name>

   <value>hdfs://yourHostName(localhost/ubuntu):9000</value>

</property>

<property>

   <name>hadoop.tmp.dir</name>

   <value>your tmp director in hdfs</value>

</property>

注意：yourHostName建议写你自己设置的hostname，不建议写localhost，因为到多节点时候很容易会出错，甚至你可以写ip地址。

另外，hadoop.tmp.dir的标签的值不是本地文件系统的地址，而是对应HDFS上的临时目录，它是在跑MapReduce程序时产生的临时文件的存放地址。

修改$HADOOP_HOME/conf/mapred-site.xml文件
在<configuration></configuration>之间加入

<property>

   <name>mapred.job.tracker</name>

   <value>yourHostName(localhost/ubuntu):9001</value>

</property>

<property>

   <name>dfs.permissions</name>

   <value>false</value>

</property>

<property>

   <name>mapred.child.java.opts</name>

   <value>-Xmx512m</value>

</property>

注意：同理,这里也不建议yourHostName写localhost

修改$HADOOP_HOME/conf/hdfs-site.xml文件
在<configuration></configuration>之间加入

<property>

   <name>dfs.name.dir</name>

   <value>/usr/local/hadoop/datalog</value>

</property>

<property>

   <name>dfs.data.dir</name>

   <value>/usr/local/hadoop/data</value>

</property>

<property>

   <name>dfs.replication</name>

   <value>1</value>

</property>

在$HADOOP_HOME/conf/master 和 $HADOOP_HOME/conf/slaves文件写入的写master机器的hostname和slaves的hostname，保存退出

格式化master机器的namenode节点
执行：
$HADOOP_HOME/bin/hadoop namenode -format

启动整个hadoop集群环境
$HADOOP_HOME/bin/start-all.sh

*******************************************************************************

hive搭建
解压好hive的包，给$HIVE_HOME/conf/hive-default.xml.template 拷贝成$HIVE_HOME/conf/hive-site.xml

修改hive的配置，因为默认的配置文件有问题

将<value>auth<auth>修改为<value>auth</value>，保存退出
这个hive和hadoop的简单对接已经完成，后面会加上mysql来作为数据类型存储源

*******************************************************************************

hive 与 mysql对接
允许其他机器访问mysql服务
修改mysql配置文件/etc/mysql/my.cnf
>skip-networking => # skip-networking //其实就是注释这一条配置选项

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

在网上下载一个mysql的java驱动，将其放到$HIVE_HOME/lib底下即可
修改$HIVE_HOME/conf/hive-site.xml文件

修改hive的配置，hive.metastore.schema.verification默认为true，修改为false

<property>

  <name>hive.metastore.schema.verification</name>

  <value>false</value>

</property>

localhost 写你的ip地址或者hostname
3306是mysql默认的通信端口
hive是你所使用mysql里面的database名字，这个database 一定是你自己手动创建的，否则hive会报错

<property>

   <name>javax.jdo.option.ConnectionURL</name>

   <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNoExist=true</value>

</property>

mysql驱动类名

<property>

   <name>javax.jdo.option.ConnectionDriverName</name>

   <value>com.mysql.jdbc.Driver</value>

</property>

所使用mysql的用户名

<property>

   <name>javax.jdo.option.ConnectorUserName</name>

   <value>hive</value>

</property>

mysql用户的密码

<property>

   <name>javax.jdo.option.ConnectionPassword</name>

   <value>hive</value>

</property>

如果你不希望使用hive这个用户，也可以自行在mysql上建立用户

mysql> CREATE USER 'hive'@'%' IDENTIFIED BY 'hive';
mysql> CREATE user 'hive'@'localhost' IDENTIFIED BY 'hive';

mysql> GRANT ALL PRIVILEGES ON *.* TO 'hive'@'%' WITH GRANT OPTION;
mysql> GRANT ALL PRIVILEGES ON *.* TO 'hive'@'localhost' with grant option;

mysql> flush privileges;

执行上面三行命令，就给mysql创建了hive这个用户了，用户名和密码都是hive

在shell里面登陆mysql的hive用户试验
mysql -uhive -phive

如果在执行上面的命令出现ERROR 1045(28000)错误，那么你就需要执行

/etc/init.d/mysql stop

mysqld_safe --user=root --skip-grant-tables --skip-networking & (这个就是降低mysql 的安全系数启动mysql 服务，是的用户无需密码就能登陆mysql 的root 用户)

/etc/init.d/mysql restart

此方法参考：http://blog.sina.com.cn/s/blog_4d0aa5f30100fobu.html中的方法一

如果忘记mysql 的root 密码，可以参考这篇博客：http://www.blogjava.net/wiflish/archive/2006/12/23/89655.html

登陆后，给hive用户创建一个名字叫hive的数据库

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

启动hive
show databases; 不出错，说明hive和mysql打通了

***************************************************************************

hbase搭建

修改$HBASE_HOME/conf/hbase_env.sh文件
export JAVA_HOME=your java_home
export HBASE_MANAGES_ZK=true
如果使用独立的zookeeper的话，$HBASE_MANAGES_ZK=false

修改$HBASE_HOME/conf/hbase-site.xml

<configuration>

  <property>

     <name>hbase.master</name>

     <value>yourHostName:60000</value>

  </property>

  <property>

     <name>hbase.rootdir</name>

     <value>hdfs://yourHostName:9000/hbase</value>

  </property>

  <property>

     <name>hbase.cluster.distributed</name>

     <value>true</value>

  </property>

  <property>

     <name>hbase.zookeeper.property.clientPort</name>

     <value>2181</value>

  </property>

  <property>

     <name>hbase.zookeeper.quorum</name>

     <value>yourHostName</value>

  </property>

</configuration>

yourHostName 都不要简单地填写localhost，要写成其他的hostname，或者是ip也行

启动hbase

$HBASE_HOME/bin/start-hbase.sh

停止hbase

$HBASE_HOME/bin/stop-hbase.sh

可以在web查看hbase的状态
http://hostname:60010

新手安装 hadoop、hive和hbase 笔记的更多相关文章

Hadoop Hive与Hbase整合+thrift
Hadoop Hive与Hbase整合+thrift 1. 简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句 ...
Hadoop Hive与Hbase关系整合
用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询.hive也即做数据仓库 1. 基于Ha ...
单机安装hadoop+hive+presto
系统环境在个人笔记本上使用virtualbox虚拟机 os:centos -7.x86-64.everything.1611 ,内核 3.10.0-514.el7.x86_64 注:同样可以使用r ...
Windows环境下安装Hadoop+Hive的使用案例
Hadoop安装: 首先到官方下载官网的hadoop2.7.7,链接如下 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 找网盘的 ...
配置Hadoop,hive,spark,hbase ————待整理
五一一天在家搭建好了集群,要上班了来不及整理,待下周周末有时间好好整理整理一个完整的搭建hadoop生态圈的集群的系列若出现license information(license not accep ...
CentOS7.0分布式安装HADOOP 2.6.0笔记-转载的
三台虚拟机,IP地址通过路由器静态DHCP分配 (这样就无需设置host了). 三台机器信息如下 - 1. hadoop-a: 192.168.0.20 #master 2. ha ...
手把手教你搭建hadoop+hive测试环境(新手向)
本文由网易云发布. 作者:唐雕龙本篇文章仅限内部分享,如需转载,请联系网易获取授权. 面向新手的hadoop+hive学习环境搭建,加对我走过的坑总结,避免大家踩坑. 对于hive相关docke ...
吴裕雄--天生自然HADOOP操作实验学习笔记：使用hive操作hbase
实验目的熟悉hive和hbase的操作熟悉hadoop.hbase.hive.zookeeper的关系熟练大数据环境的搭建学会分析日志排除问题实验原理 1.hive整合hbase原理前面大 ...
Hadoop + Hive + HBase + Kylin伪分布式安装
问题导读 1. Centos7如何安装配置? 2. linux网络配置如何进行? 3. linux环境下java 如何安装? 4. linux环境下SSH免密码登录如何配置? 5. linux环境下H ...

随机推荐

java之快速排序
//基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据 ...
Java笔记之利用反射访问或修改private成员
对于类A.B,A是B的基类,A有一个私有成员name A.java public class A { private String name = "A"; public void ...
ideal 控制台乱码解决
run config 中 tomcat VM options中填入一下命令 -Dfile.encoding=UTF-8
Linux升级安装GCC G++ 6.2
使用yum安装是不可能了,各大仓库也没有,只能自己编译安装了. 系统为CentOS 6.5,gcc为4.4.7 1 下载源代码包当前最新版为6.2: wget http://ftp.gnu.org/ ...
CSU1808 地铁 —— dijkstra变形
题目链接:http://acm.csu.edu.cn/csuoj/problemset/problem?pid=1808 题解:由于中转线路需要花费一定的时间,所以一般的以顶点为研究对象的dijkst ...
jinja 多值合并
示例 {% for node in groups["db"] %} {{ node | join("") }}:5672 {% if not loop.last ...
Java线程池技术以及实现
对于服务端而言,经常面对的是客户端传入的短小任务,需要服务端快速处理并返回结果.如果服务端每次接受一个客户端请求都创建一个线程然后处理请求返回数据,这在请求客户端数量少的阶段看起来是一个不错的选择,但 ...
DGA域名——可以每天只生成一个域名，因此最多存在365个 DGA域名；
Mirai变种中的DGA 分享到: 发布时间:2016-12-12 16:02:57 作者:360网络安全研究院投稿方式:发送邮件至linwei#360.cn,或登陆网页版在线投稿那个导致美国断网 ...
MongoDB 项目集成 mongo-driver 3.4.2
第一次写技术!大白话讲讲.拿着用就可以了本人是,NET的技术人员,会点JAVA所以很多不专业,见谅哈刚刚开始使用mongo 整整搞了两天我才搞个半桶水,还是将就着用吧随便把mongo在win的搭 ...
mycat的事务支持情况
中秋国庆一共12天,玩的有点嗨,完全没想工作的事情- -.回来赶紧补补.看了一下mycat关于事务的支持情况,做一下记录. 说mycat的事务支持之前,先说说XA协议,即分布式事务.指的是TM(事务管 ...

新手安装 hadoop、hive和hbase 笔记

新手安装 hadoop、hive和hbase 笔记的更多相关文章

随机推荐

热门专题