hadoop入门(二)
hadoop的配置
1.本地模式
2.伪分布式
3.分布式
 
 
一、配置linux环境:
1打开虚拟网络编辑器,选择 VMnet1 仅主机模式,
子网 IP 设为 192.168.1.0 ,子网掩码设为 255.255.255.0
2.增加用户组
创建用户:
adduser 用户名
password  用户名
# useradd dev #创建用户
# passwd dev #修改密码
更改用户 dev 的密码 。
新的 密码:
重新输入新的 密码:
passwd:所有的身份验证令牌已经成功更新。
3.修改linuxIP地址
4.修改主机名
vi /etc/sysconfig/network
5.配置主机名和本地映射关系
vi /etc/hosts
6.关闭防火墙
#查看防火墙状态
service iptables status
#关闭防火墙
service iptables stop
#查看防火墙开机启动状态
chkconfig iptables --list
#关闭防火墙开机启动
chkconfig iptables off
5.在windows上配置主机名的映射
6.安装jdk
6.卸载本身带的JDK
rpm-qa|grep jdk
rpm -e --nodeps[jdk名称1 jdk名称2]
7.root用户下设置无密码用户切换
ls-l/etc/sudoers
vi /etc/sudoers
加:一行
用户名 ALL=(root)NOPASSWD:ALL
 
克隆虚拟机并进行相关的配置
 
  1. 创建我们要使用的目录
Sudo mkdir /opt/softwares
Sudo mkdir /opt/modules
Sudo mkdir /opt/tools
Sudo mkdir/opt/datas
 
  1. 将root用户的目录改变成kfk用户所属目录
Sudo chown –R kfk:kfk /opt/*
  1. 将JDK安装包通过工具上传到/opt/softwares目录下
  2. 更改文件的可执行权限
Chmod u+x /opt/softwares/*
  1. 安装解压JDK
Tar –zxf jdk  -C /opt/modules/
  1. 配置jdk环境
  2. 修改虚拟机大小
  3. 修改虚拟机名称
 
 
 
二、配置hadoop环境
1.配置hadoo环境变量
在vi /software/hadoop-2.5.0/etc/hadoop/hadoop-env.sh
添加export JAVA_HOME=/opt/software/jdk1.8.0_11
2.修改 core-site.xml 文件
用来设置namenode的地址
这个用来设置namenode的地址
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
 
 
指定hadoop运行时产生的文件存储位置
<configuration>
    <property>
        <name> hadoop.tmp.dir</name>
        <value>/opt/modules/hadoop-2.5.0/data/tmp</value>
    </property>
</configuration>
 
3.修改hdfs.site.xml 文件
用来修改datanode的副本数
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>
 
4:修改:mapred-site.xml:
目的是让mapred运行在yarn上
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
 
5.修改:yarn.site.xml
<configuration>
      
        <property>
                     <name>yarn.resourcemanager.hostname</name>
                     <value>bigdata-pro01</value>
              </property>
        <property>
                     <name>yarn.nodemanager.aux-services</name>
                     <value>mapreduce_shuffle</value>
              </property>
</configuration>
 
第一个property是用来指定resoucemanager的地址
第二个property是用来reducer获取数据的方式
 
 
6.修改环境变量
#HADOOP_HOME
Export HADOOP_HOME=/opt/modules/hadoop-2.5.0
Export PATH=$PATH:$HADOOP_HOME/bin
 
生效环境变量:
Source /etc/profile
 
7.格式化HDFS
Bin/hdfs namenode -format

hadoop(2)hadoop配置的更多相关文章

  1. Hadoop安装及配置

    一.系统及软件环境 1.操作系统 CentOS release 6.5 (Final) 内核版本:2.6.32-431.el6.x86_64 master.fansik.com:192.168.83. ...

  2. 初识Hadoop一,配置及启动服务

    一.Hadoop简介: Hadoop是由Apache基金会所开发的分布式系统基础架构,实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS:Hadoo ...

  3. [Hadoop入门] - 2 ubuntu安装与配置 hadoop安装与配置

    ubuntu安装(这里我就不一一捉图了,只引用一个网址, 相信大家能力) ubuntu安装参考教程:  http://jingyan.baidu.com/article/14bd256e0ca52eb ...

  4. Hadoop伪分布模式配置

    本作品由Man_华创作,采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可.基于http://www.cnblogs.com/manhua/上的作品创作. 请先按照上一篇文章H ...

  5. Hadoop伪分布配置与基于Eclipse开发环境搭建

    国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...

  6. Hadoop伪分布模式配置部署

    .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

  7. Hadoop 2、配置HDFS HA (高可用)

    前提条件 先搭建 http://www.cnblogs.com/raphael5200/p/5152004.html 的环境,然后在其基础上进行修改 一.安装Zookeeper 由于环境有限,所以在仅 ...

  8. spark快速入门之最简配置 spark 1.5.2 hadoop 2.7 配置

    配置的伪分布式,ubuntu14.04上 先配置hadoop,参见这个博客,讲的很好 http://www.powerxing.com/install-hadoop/, 但是我在配的过程中还是遇到了问 ...

  9. hadoop 各种组件配置参数

    ********************************************hive*********************************************** hive ...

  10. Hadoop集群配置(最全面总结)

    Hadoop集群配置(最全面总结) 通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker.这些机器是masters.余下的机器即作为DataNode也作为Ta ...

随机推荐

  1. SCANF输入错误

    while((a<=0||a>=10)||(b<=0||b>=10))    {        fflush(stdin);        cout<<" ...

  2. 迅为IMX6Q四核核心板商业级|工业级|IMX6Plus版本|IMX6DL双核核心板

    IMX6Q处理器:兼容单核,双核,工业级,汽车级,IMX6Q最新Plus版本,共用同一底板,高端产品无忧. i.MX6系列针对消费电子.工业控制和汽车应用领域,它将ARM Cortex-A9架构的高功 ...

  3. swift try try? try!

    try You have 2 options when you try calling a function that may throw. You can take responsibility o ...

  4. jQuery 点击查看 收起

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  5. cpio - 存取归档包中的文件

    总览 (SYNOPSIS) cpio {-o|--create} [-0acvABLV] [-C bytes] [-H format] [-M message] [-O [[user@]host:]a ...

  6. 手动配置webpack

    //注:“__dirname”是node.js中的一个全局变量,它指向当前执行脚本所在的目录.const path = require('path');const webpack = require( ...

  7. java线程池,信号量使用demo

    直接上代码 package org.jimmy.threadtest20181121; import java.util.concurrent.LinkedBlockingQueue; import ...

  8. JavaSE-15 Log4j参数详解

    一:日志记录器输出级别,共有5级(从前往后的顺序排列) ①fatel:指出严重的错误事件将会导致应用程序的退出 ②error:指出虽然发生错误事件,但仍然不影响系统的继续运行 ③warn:表明会出现潜 ...

  9. python 弹窗

    import ctypes message = ctypes.windll.user32.MessageBoxA(0,'message','tips',0)

  10. Bullet:MySQL增强半同步参数rpl_semi_sync_master_wait_point值AFTER_SYNC和AFTER_COMMIT的对比实验

    MySQL 5.7.22启用增强半同步复制 MySQL对该参数值的描述 Semisync can wait for slave ACKs at one of two points, AFTER_SYN ...