一、Hadoop的安装

①Hadoop运行的前提是本机已经安装了JDK,配置JAVA_HOME变量
②在Hadoop中启动多种不同类型的进程
        例如NN,DN,RM,NM,这些进程需要进行通信!
        在通信时,常用主机名进行通信!
        
        在192.168.6.100机器上的DN进程,希望访问192.168.6.104机器的NN进程!
        需要在集群的每台机器上,配置集群中所有机器的host映射!
        配置:
            Linux:   /etc/hosts
            Windows:  C:\Windows\System32\drivers\etc\hosts
            
        不配报错:  
                 DNS映射异常,HOST映射异常
                
③注意权限
        hadoop框架在运行需要产生很多数据(日志),数据的保存目录,必须让当前启动hadoop进程的用户拥有写权限!
        
④关闭防火墙,设置开机不自启动
        service iptables stop
        chkconfig iptables off
        
二、使用普通用户操作
①创建普通用户atguigu
        useradd atguigu
        
②为atgugiu用户设置密码
        passwd atguigu
③赋予atguigu用户root权限
        vim /etc/sudoers
        
④将/opt目录下创建的soft目录和module目录的所属主修改为atguigu
        chown -R atguigu:atguigu /opt/soft /opt/module
        
三、hadoop的目录介绍

bin:  使用Hdfs和运算MR时,常用的目录!
            常用hadoop命令!
sbin:  管理员启动和停止集群使用的命令!

etc:  hadoop配置文件所在的目录

四、使用HDFS
        完成大数据的存储!
        HDFS(hadoop distributed filesystem)
        
        HDFS的运行模式:
                取决于参数:  fs.defaultFS=file:///(默认)
                 fs.defaultFS在core-default.xml中!
                    ①本地模式(在本机上使用HDFS,使用的就是本机的文件系统)
                            fs.defaultFS=file:///
                    ②分布式模式
                            要使用的文件系统是一个分布式的文件系统!
                            一个分布式的文件系统,必须由NN,DN等若干进程共同运行完成文件系统的读写操作!
                            fs.defaultFS=hdfs://
                            
                    启动NN:  hadoop-daemon.sh start namenode
                    停止NN:  hadoop-daemon.sh stop namenode
                    启动DN:  hadoop-daemon.sh start datanode
                    停止DN:  hadoop-daemon.sh stop datanode
                    
        使用:  hadoop fs  命令  文件路径

五、运行MapReduce
        完成大数据的计算!
        ①按照MR的规范编写一个程序
        ②将程序打包为jar
        ③运行jar中的程序
                
                两种运行模式:
                        取决于参数:  mapreduce.framework.name=local(默认)
                    ①本地模式(在本机上运行MR)   mapreduce.framework.name=local
                            在本机运行MR!在本机使用多线程的方式,运行多个Task!
                    ②在YARN上运行  mapreduce.framework.name=yarn
                            将MR提交给YARN,由YARN将Job中的多个task分配到多台机器中,启动container运行task!
                            
                            需要启动YARN,YARN由RM和NM进程组成!
        
        
六、hadoop的配置文件
        hadoop安装后,hadoop的性能和表现取决于用户的配置!
        
        4个默认的配置文件:
                位置:  HADOOP_HOME/share/xxxx.jar/xxx-default.xml
                core-default.xml: 设置hadoop最核心的参数!
                hdfs-default.xml   保存的是hdfs相关的参数!
                
                mapred-default.xml: MR程序在运行时,需要使用的参数!
                yarn-default.xml: yarn在启动时,需要的参数!
        
        4个用户可以自定义的配置文件: xxx-site.xml
                core-site.xml: 用户自定义的设置hadoop最核心的参数!
                hdfs-site.xml   用户自定义的保存的是hdfs相关的参数!
                
                mapred-site.xml: 用户自定义的MR程序在运行时,需要使用的参数!
                yarn-site.xml: 用户自定义的yarn在启动时,需要的参数!
        
        用户自定义的配置文件,可以覆盖默认配置文件中同名的参数的值!
        
        Hadoop在启动时,先加载4个默认的配置文件,再加载用户自定义的配置文件,如果用户自定义的配置文件
        中有和4个默认配置文件中门的参数,可以覆盖之前已经加载的值!

七、在使用hadoop命令时
        可以自定义配置文件的目录:  hadoop --config 配置文件的目录
        如果没有配置,默认读取  HADOOP_HOME/etc/hadoop 中对应的配置文件!
        
        hadoop-daemon.sh start namenode脚本在执行时,只会去默认的目录中读取配置文件!

Hadoop的安装配置(一)的更多相关文章

  1. Hadoop单机安装配置过程:

    1. 首先安装JDK,必须是sun公司的jdk,最好1.6版本以上. 最后java –version 查看成功与否. 注意配置/etc/profile文件,在其后面加上下面几句: export JAV ...

  2. Hadoop简单安装配置

    Hadoop开始设计以Linux平台为运行目标,所以这里推荐在Linux发行版比如Ubuntu进行安装,目前已经有Hadoop for Windows出来,大家自行搜下文章. Hadoop运行模式分为 ...

  3. Hadoop详细安装配置过程

    步骤一:基础环境搭建 1.下载并安装ubuntukylin-15.10-desktop-amd64.iso 2.安装ssh sudo apt-get install openssh-server op ...

  4. Hadoop HA- zookeeper安装配置

    安装集群 1.1 虚拟机: 3台安装好JDK的centos Linux虚拟机 1.2 安装包: 把下载好的zookeeper安装包,官网:http://mirror.bit.edu.cn/apache ...

  5. 【大数据】Hadoop单机安装配置

    1.解压缩hadoop-2.7.6.tar.gz到/home/hadoop/Soft目录中 2.创建软链接,方便hadoop升级  ln -s /home/hadoop/Soft/hadoop-2.7 ...

  6. hadoop搭建杂记:Linux下hadoop的安装配置

    VirtualBox搭建伪分布式模式:hadoop的下载与配置 VirtualBox搭建伪分布式模式:hadoop的下载与配置 由于个人机子略渣,无法部署XWindow环境,直接用的Shell来操作, ...

  7. hadoop的安装配置

    资源下载路径:https://archive.cloudera.com/cdh5/cdh/5/:https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0 ...

  8. Docker Hadoop LAMP安装配置教程

    以下教程来自九章算法. 1.How to install Dockerhttps://bupt.quip.com/YehSAR4qnGqB 2.How to set up hadoop environ ...

  9. Hadoop 单机安装配置

随机推荐

  1. [LeetCode]1464. 数组中两元素的最大乘积

    给你一个整数数组 nums,请你选择数组的两个不同下标 i 和 j,使 (nums[i]-1)*(nums[j]-1) 取得最大值. 请你计算并返回该式的最大值. 示例 1: 输入:nums = [3 ...

  2. 深度剖析数仓CN增量备份技术

    摘要:为了解决Roach的性能问题,提出了CN增量备份手段,从而达到进一步优化RPO目的. 本文分享自华为云社区<GaussDB(DWS)备份容灾之CN增量备份>,作者: zxy_db . ...

  3. Oracle数据库的下载、安装与卸载

    Oracle数据库下载: 这里以Oracle 11g为例,推荐去Oracle官网下载 Oracle官网下载地址:https://www.oracle.com/database/technologies ...

  4. 用MySQL碰到的一些“坑”

    本篇文章持续更新. 这里说坑,也不算坑,只是对我一个经常用SQL Server的来说有点不习惯而已. 一.GroupBy 的不同 create table Customer ( CustomerNum ...

  5. c# TextBox只能输入数字的处理方法(完整版各种情况考虑在内,可根据需求灵活修改)

    //选择文本框的事件窗口,找到按键输入的方法KeyPress,双击建立新的方法. /// <summary> /// textBox只能输入数字的处理方法 /// </summary ...

  6. matplotlib(终章)

    今日内容概要 matplotlib实际案例演示 各种图形的总结 数据清洗(简单) 数据清洗的案例 今日内容详细 matplotlib实际案例演示 # 2.绘制每年电影上映数量曲线图 首先载入模块 im ...

  7. JAVA 异常和异常处理

    目录 一.异常 1.基本概念 2.异常体系图 3.五大运行时异常 4.编译异常 二.异常处理 1.异常处理的方式 1.1try-catch异常处理 注意事项 课堂练习题 1.2throws异常处理 注 ...

  8. 【spring源码系列】之【Bean的销毁】

    以"冬奥之光,多彩冰灯"为主题的第四十一届全国专业冰雕比赛在冰城哈尔滨市进入第二天,60名冰雕高手在哈尔滨冰灯艺术游园会园区展开激烈的竞技比拼. 冰雕艺术 1. 概述 Bean的销 ...

  9. cobbler check执行报错

    httpd does not appear to be running and proxying cobbler, or SELinux is in the way. 当执行cobbler check ...

  10. tp5.0使用JWT完成token认证技术

    1.安装 composer require firebase/php-jwt 2.封装(在框架根目录extend下新建Token.php) 复制代码 <?php use Firebase\JWT ...