一、Hadoop的安装

①Hadoop运行的前提是本机已经安装了JDK,配置JAVA_HOME变量
②在Hadoop中启动多种不同类型的进程
        例如NN,DN,RM,NM,这些进程需要进行通信!
        在通信时,常用主机名进行通信!
        
        在192.168.6.100机器上的DN进程,希望访问192.168.6.104机器的NN进程!
        需要在集群的每台机器上,配置集群中所有机器的host映射!
        配置:
            Linux:   /etc/hosts
            Windows:  C:\Windows\System32\drivers\etc\hosts
            
        不配报错:  
                 DNS映射异常,HOST映射异常
                
③注意权限
        hadoop框架在运行需要产生很多数据(日志),数据的保存目录,必须让当前启动hadoop进程的用户拥有写权限!
        
④关闭防火墙,设置开机不自启动
        service iptables stop
        chkconfig iptables off
        
二、使用普通用户操作
①创建普通用户atguigu
        useradd atguigu
        
②为atgugiu用户设置密码
        passwd atguigu
③赋予atguigu用户root权限
        vim /etc/sudoers
        
④将/opt目录下创建的soft目录和module目录的所属主修改为atguigu
        chown -R atguigu:atguigu /opt/soft /opt/module
        
三、hadoop的目录介绍

bin:  使用Hdfs和运算MR时,常用的目录!
            常用hadoop命令!
sbin:  管理员启动和停止集群使用的命令!

etc:  hadoop配置文件所在的目录

四、使用HDFS
        完成大数据的存储!
        HDFS(hadoop distributed filesystem)
        
        HDFS的运行模式:
                取决于参数:  fs.defaultFS=file:///(默认)
                 fs.defaultFS在core-default.xml中!
                    ①本地模式(在本机上使用HDFS,使用的就是本机的文件系统)
                            fs.defaultFS=file:///
                    ②分布式模式
                            要使用的文件系统是一个分布式的文件系统!
                            一个分布式的文件系统,必须由NN,DN等若干进程共同运行完成文件系统的读写操作!
                            fs.defaultFS=hdfs://
                            
                    启动NN:  hadoop-daemon.sh start namenode
                    停止NN:  hadoop-daemon.sh stop namenode
                    启动DN:  hadoop-daemon.sh start datanode
                    停止DN:  hadoop-daemon.sh stop datanode
                    
        使用:  hadoop fs  命令  文件路径

五、运行MapReduce
        完成大数据的计算!
        ①按照MR的规范编写一个程序
        ②将程序打包为jar
        ③运行jar中的程序
                
                两种运行模式:
                        取决于参数:  mapreduce.framework.name=local(默认)
                    ①本地模式(在本机上运行MR)   mapreduce.framework.name=local
                            在本机运行MR!在本机使用多线程的方式,运行多个Task!
                    ②在YARN上运行  mapreduce.framework.name=yarn
                            将MR提交给YARN,由YARN将Job中的多个task分配到多台机器中,启动container运行task!
                            
                            需要启动YARN,YARN由RM和NM进程组成!
        
        
六、hadoop的配置文件
        hadoop安装后,hadoop的性能和表现取决于用户的配置!
        
        4个默认的配置文件:
                位置:  HADOOP_HOME/share/xxxx.jar/xxx-default.xml
                core-default.xml: 设置hadoop最核心的参数!
                hdfs-default.xml   保存的是hdfs相关的参数!
                
                mapred-default.xml: MR程序在运行时,需要使用的参数!
                yarn-default.xml: yarn在启动时,需要的参数!
        
        4个用户可以自定义的配置文件: xxx-site.xml
                core-site.xml: 用户自定义的设置hadoop最核心的参数!
                hdfs-site.xml   用户自定义的保存的是hdfs相关的参数!
                
                mapred-site.xml: 用户自定义的MR程序在运行时,需要使用的参数!
                yarn-site.xml: 用户自定义的yarn在启动时,需要的参数!
        
        用户自定义的配置文件,可以覆盖默认配置文件中同名的参数的值!
        
        Hadoop在启动时,先加载4个默认的配置文件,再加载用户自定义的配置文件,如果用户自定义的配置文件
        中有和4个默认配置文件中门的参数,可以覆盖之前已经加载的值!

七、在使用hadoop命令时
        可以自定义配置文件的目录:  hadoop --config 配置文件的目录
        如果没有配置,默认读取  HADOOP_HOME/etc/hadoop 中对应的配置文件!
        
        hadoop-daemon.sh start namenode脚本在执行时,只会去默认的目录中读取配置文件!

Hadoop的安装配置(一)的更多相关文章

  1. Hadoop单机安装配置过程:

    1. 首先安装JDK,必须是sun公司的jdk,最好1.6版本以上. 最后java –version 查看成功与否. 注意配置/etc/profile文件,在其后面加上下面几句: export JAV ...

  2. Hadoop简单安装配置

    Hadoop开始设计以Linux平台为运行目标,所以这里推荐在Linux发行版比如Ubuntu进行安装,目前已经有Hadoop for Windows出来,大家自行搜下文章. Hadoop运行模式分为 ...

  3. Hadoop详细安装配置过程

    步骤一:基础环境搭建 1.下载并安装ubuntukylin-15.10-desktop-amd64.iso 2.安装ssh sudo apt-get install openssh-server op ...

  4. Hadoop HA- zookeeper安装配置

    安装集群 1.1 虚拟机: 3台安装好JDK的centos Linux虚拟机 1.2 安装包: 把下载好的zookeeper安装包,官网:http://mirror.bit.edu.cn/apache ...

  5. 【大数据】Hadoop单机安装配置

    1.解压缩hadoop-2.7.6.tar.gz到/home/hadoop/Soft目录中 2.创建软链接,方便hadoop升级  ln -s /home/hadoop/Soft/hadoop-2.7 ...

  6. hadoop搭建杂记:Linux下hadoop的安装配置

    VirtualBox搭建伪分布式模式:hadoop的下载与配置 VirtualBox搭建伪分布式模式:hadoop的下载与配置 由于个人机子略渣,无法部署XWindow环境,直接用的Shell来操作, ...

  7. hadoop的安装配置

    资源下载路径:https://archive.cloudera.com/cdh5/cdh/5/:https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0 ...

  8. Docker Hadoop LAMP安装配置教程

    以下教程来自九章算法. 1.How to install Dockerhttps://bupt.quip.com/YehSAR4qnGqB 2.How to set up hadoop environ ...

  9. Hadoop 单机安装配置

随机推荐

  1. Go Exec 僵尸与孤儿进程

    原文地址:Go Exec 僵尸与孤儿进程 最近,使用 golang 去管理本地应用的生命周期,期间有几个有趣的点,今天就一起看下. 场景一 我们来看看下面两个脚本会产生什么问题: 创建两个 shell ...

  2. BI可视化在线分析工具,推荐这2个BI工具!

    ​一.国外BI----tableau   BI平台Tableau帮助企业可视化和理解数据.它使组织能够通过PC或iPad连接,可视化和共享数据.用户可以轻松创建仪表板,发布甚至与同事,合作伙伴和客户共 ...

  3. 详解 c# 克隆

    克隆方法是原型设计模式中必须使用的方式,它将返回一个与当前对象数据一致的对象.正如其名,犹如一个模子雕刻而出.克隆类型分为两种:浅克隆.深克隆. 浅复制就是仅复制类中的值类型成员 深复制就是复制类中的 ...

  4. MySQL 8.0.25 MSI Install 安装过程

    官网下载地址: https://dev.mysql.com/downloads/mysql   其中web-community需要联网安装,另外一个可以离线安装.我下载的是离线安装包.   1.双击安 ...

  5. ValueError: not enough values to unpack

    当在同一行为两个变量赋值时,要用分号;而非逗号,隔开

  6. Linux的用户与用户组管理

    1.Linux用户与用户组 Linux 是多用户多任务操作系统,Linux 系统支持多个用户在同一时间内登陆,不同用户可以执行不同的任务,并且互不影响.不同用户具有不问的权限,毎个用户在权限允许的范围 ...

  7. JZ-057-二叉树的下一个结点

    二叉树的下一个结点 题目描述 给定一个二叉树和其中的一个结点,请找出中序遍历顺序的下一个结点并且返回.注意,树中的结点不仅包含左右子结点,同时包含指向父结点的指针. 题目链接: 二叉树的下一个结点 代 ...

  8. JZ-038-二叉树的深度

    二叉树的深度 题目描述 输入一棵二叉树,求该树的深度.从根结点到叶结点依次经过的结点(含根.叶结点)形成树的一条路径,最长路径的长度为树的深度. 题目链接: 二叉树的深度 代码 /** * 标题:二叉 ...

  9. LeetCode-007-整数反转

    整数反转 题目描述:给你一个 32 位的有符号整数 x ,返回将 x 中的数字部分反转后的结果. 如果反转后整数超过 32 位的有符号整数的范围 [\(−2^{31}\), \(2^{31}\) − ...

  10. vue用ElementUI导出Excel表格

    import axios from 'axios'; import qs from 'qs'; import { message } from 'element-ui';   export const ...