CDH5.2+CM5.2+impala2+Spark1.1 集群搭建基础环境准备
測试集群简单介绍:一共同拥有4台机器:10.10.244.136、10.10.244.137、10.10.244.138、10.10.244.139。
10.10.244.136是管理节点。另外3台是存储节点。准备工作详情例如以下:
1 在四台机器上安装CentOS release 6.5 (Final) 64位(管理节点须要安装Mysql\Postgresql\redhat_lsb)
2 CDH5.2(包括了Spark1.1) YUM源搭建、CM5.2 YUM源搭建、impala2 YUM 源搭建
CDH5.2仓库地址:http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
CM5.2仓库地址:http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/
impala2仓库地址:http://archive-primary.cloudera.com/impala/redhat/6/x86_64/impala/2/
3 关闭4台机器的selinux
cd /etc/selinux; vi config;SELINUX=disabled(找到它,改动成这样)
4 关闭4台机器的iptables(防火墙。CentoOS7.0 中就不是它了,好像是firewalk)
chkconfig --level 35 iptables off;
5 改动四台机器的hostname分别为master01.pmsc.gov.cn、datanode01.pmsc.gov.cn、datanode02.pmsc.gov.cn、 datanode03.pmsc.gov.cn
cd /etc/sysconfig; vi network;HOSTNAME=master01.pmsc.gov.cn(类似于这样改动)
6 在4台机器分别创建cloudera用户
groupadd cloudera;useradd -g cloudera cloudera;passwd cloudera;
7 让4台机器上的cloudera用户能够无password获得sudo权限
cd /etc;chmod u+w sudoers;vi sudoers;cloudera ALL=(ALL) ALL;%cloudera ALL=(ALL)NOPASSWD : ALL(这两句话加入在root ALL=(ALL) ALL下方);chmod u-w sudoers
8 在4台机器间配置cloudera用户的SSH无password通信
cd /etc;vi hosts;加入例如以下内容
10.10.244.136 master01.pmsc.gov.cn
10.10.244.137 datanode01.pmsc.gov.cn
10.10.244.138 datanode02.pmsc.gov.cn
10.10.244.139 datanode03.pmsc.gov.cn
10.10.244.129 archive.cloudera.com (YUM源本地机器)
cd /home/cloudera/.ssh;rm -rf *;ssh-keygen -t rsa -P '';cat id_rsa.pub>>authorized_keys(在4台机器上运行同样的操作,合并authorized_keys文件内容,并覆盖每一个机器上的authorized_keys文件);chmod 600 authorized_keys;
9 在4台机器之间做时钟同步。保证时间的一致性(136 自己同步自己。其他机器同步136的时间。
)
136上的配置(/etc/ntp.conf)
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
server 127.127.1.0
fudge 127.127.1.0 stratum 8
137\138\139上的配置(/etc/ntp.conf)
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
server 10.10.244.136
fudge 10.10.244.136 stratum 8
136\137\138\139设置ntpd服务开机自启动
sudo chkconfig ntpd on
137\138\139上在cloudera用户下每天同步一次时间(使用crontab)
30 21 * * * sudo ntpdate 10.10.244.131
10 在4台机器上安装JDK(最小版本号1.7.0_67)
sudo vi /etc/profile;加入例如以下配置
export JAVA_HOME=/usr/local/jdk1.7.0_71
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
11 Mysql数据的安装配置
默认字符编码设置为utf-8:
[mysqld]
character-set-server=utf8
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
[client]
port = 3306
socket = /var/lib/mysql/mysql.sock
default-character-set=utf8
[mysql]
no-auto-rehash
default-character-set=utf8
改动root账户password:update user set Password = Password('test') where Host = '%' and User = 'root';flush privileges;
开启远程登录:update user set host = ‘%’ where user = ‘root’;flush privileges;
改动数据文件存储位置:
[mysqld]
datadir=/home/mysql
socket=/home/mysql/mysql.sock
设置开机自启动:sudo chkconfig mysqld on
CDH5.2+CM5.2+impala2+Spark1.1 集群搭建基础环境准备的更多相关文章
- hadoop 1.2 集群搭建与环境配置
一.虚拟机环境 见我的另一篇博客http://www.cnblogs.com/xckk/p/6000881.html, 需要安装JDK环境,centos下安装JDK可参考: http://www.ce ...
- Spark1.3.1 On Yarn的集群搭建
下面给出的是spark集群搭建的环境: 操作系统:最小安装的CentOS 7(下载地址) Yarn对应的hadoop版本号:Hadoop的Cloudera公司发行版Hadoop2.6.0-CDH5.4 ...
- Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
- Hadoop+HBase 集群搭建
Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...
- 基于centos6.5 hbase 集群搭建
注意本章内容是在上一篇文章“基于centos6.5 hadoop 集群搭建”基础上创建的 1.上传hbase安装包 hbase-0.96.2-hadoop2 我的目录存放在/usr/hadoop/hb ...
- Elasticsearch集群搭建及使用Java客户端对数据存储和查询
本次博文发两块,前部分是怎样搭建一个Elastic集群,后半部分是基于Java对数据进行写入和聚合统计. 一.Elastic集群搭建 1. 环境准备. 该集群环境基于VMware虚拟机.CentOS ...
- zookeeper与卡夫卡集群搭建
首先这片博客没有任何理论性的东西,只是详细说明kafka与zookeeper集群的搭建过程,需要三台linux服务器. java环境变量设置 zookeeper集群搭建 kafka集群搭建 java环 ...
- 大数据中Hadoop集群搭建与配置
前提环境是之前搭建的4台Linux虚拟机,详情参见 Linux集群搭建 该环境对应4台服务器,192.168.1.60.61.62.63,其中60为主机,其余为从机 软件版本选择: Java:JDK1 ...
- zookeeper相关知识与集群搭建
Zookeeper Zookeeper相关概念 Zookeeper概述 Zookeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题. Zookeeper本质上是一个 ...
随机推荐
- 【网络文摘】Androidguy:当你的才华还无法撑起你的野心时,那么应该静下心来学习
[序] 2013年12月初,接到51CTO的邀请写一篇关于挨踢人物传记的邀请.尽管写文章对我已不是什么新鲜事.数年来写的书和博客至少也在600万字以上.不过基本都是与技术有关的.写传记这还是头一次,也 ...
- Android ShareSDKQQ 第三方登录so easy?
昨天群里有个群友看到我之前做的那个qq第三方登录怎么做的,于是乎思考了一下,还是决定写一篇博客记录下.事实上都不难的,事实上之前我又写到FaceBook的第三方登录不知道看下这Android集成Fac ...
- Discuz常见小问题-网站如何备份和恢复
进入后台之后,点击UCenter,然后在左侧的数据备份中点击提交,大概一两分钟会显示备份完成 备份好的数据在uc_server的data/backup文件夹中(文件名为时间+随机字符,里面就一个数据库 ...
- hdu-悼念512汶川大地震遇难同胞——珍惜现在,感恩生活
http://acm.hdu.edu.cn/showproblem.php?pid=2191 Problem Description 急!灾区的食物依然短缺! 为了挽救灾区同胞的生命,心系灾区同胞的你 ...
- MVC3循环添加数据
foreach (var item in orderdetails) { var billdetails = new BillDetail(){BillCode = billoflading.Bill ...
- TOMCAT清理
CreateTime--2017年7月10日08:54:00Author:Marydon 如何清理TOMCAT 方式一:通过tomcat的安装目录进行清理 找到TOMCAT的根目录,如图: 实质: ...
- Oracle EBS SLA(子分类账)
SLA概述 SLA(Subledger Accounting) 子帐是子分类帐会计的简称,字面上的含义就是子分类帐会计分录 SLA常用表介绍 在SLA中技术方面最常用的就是日记账来源追溯,在追溯的过程 ...
- 1、配置JAVA的环境变量
想要成功配置Java的环境变量,那肯定就要安装JDK,才能开始配置的. 想要成功配置Java的环境变量,那肯定就要安装JDK,才能开始配置的. 安装JDK 向导进行相关参数设置.如图: 正在安装程 ...
- 数据库选型之亿级数据量并发访问(MySQL集群)
刘 勇 Email:lyssym@sina.com 简介 针对实际应用中并发访问MySQL的场景,本文采用多线程对MySQL进行并发读取访问,其中以返回用户所需的数据并显示在终端为测试结束节点,即将 ...
- Centos调出图形化的网络管理
在Linux中设置网路,图形化很方便.在命令行下/etc/sysconfig/network-scripts/ifcfg-eth0 00.命令行下修正网路 [root@dzswj-test ~]#ca ...