一、Hadoop的安装

①Hadoop运行的前提是本机已经安装了JDK,配置JAVA_HOME变量
②在Hadoop中启动多种不同类型的进程
        例如NN,DN,RM,NM,这些进程需要进行通信!
        在通信时,常用主机名进行通信!
        
        在192.168.6.100机器上的DN进程,希望访问192.168.6.104机器的NN进程!
        需要在集群的每台机器上,配置集群中所有机器的host映射!
        配置:
            Linux:   /etc/hosts
            Windows:  C:\Windows\System32\drivers\etc\hosts
            
        不配报错:  
                 DNS映射异常,HOST映射异常
                
③注意权限
        hadoop框架在运行需要产生很多数据(日志),数据的保存目录,必须让当前启动hadoop进程的用户拥有写权限!
        
④关闭防火墙,设置开机不自启动
        service iptables stop
        chkconfig iptables off
        
二、使用普通用户操作
①创建普通用户atguigu
        useradd atguigu
        
②为atgugiu用户设置密码
        passwd atguigu
③赋予atguigu用户root权限
        vim /etc/sudoers
        
④将/opt目录下创建的soft目录和module目录的所属主修改为atguigu
        chown -R atguigu:atguigu /opt/soft /opt/module
        
三、hadoop的目录介绍

bin:  使用Hdfs和运算MR时,常用的目录!
            常用hadoop命令!
sbin:  管理员启动和停止集群使用的命令!

etc:  hadoop配置文件所在的目录

四、使用HDFS
        完成大数据的存储!
        HDFS(hadoop distributed filesystem)
        
        HDFS的运行模式:
                取决于参数:  fs.defaultFS=file:///(默认)
                 fs.defaultFS在core-default.xml中!
                    ①本地模式(在本机上使用HDFS,使用的就是本机的文件系统)
                            fs.defaultFS=file:///
                    ②分布式模式
                            要使用的文件系统是一个分布式的文件系统!
                            一个分布式的文件系统,必须由NN,DN等若干进程共同运行完成文件系统的读写操作!
                            fs.defaultFS=hdfs://
                            
                    启动NN:  hadoop-daemon.sh start namenode
                    停止NN:  hadoop-daemon.sh stop namenode
                    启动DN:  hadoop-daemon.sh start datanode
                    停止DN:  hadoop-daemon.sh stop datanode
                    
        使用:  hadoop fs  命令  文件路径

五、运行MapReduce
        完成大数据的计算!
        ①按照MR的规范编写一个程序
        ②将程序打包为jar
        ③运行jar中的程序
                
                两种运行模式:
                        取决于参数:  mapreduce.framework.name=local(默认)
                    ①本地模式(在本机上运行MR)   mapreduce.framework.name=local
                            在本机运行MR!在本机使用多线程的方式,运行多个Task!
                    ②在YARN上运行  mapreduce.framework.name=yarn
                            将MR提交给YARN,由YARN将Job中的多个task分配到多台机器中,启动container运行task!
                            
                            需要启动YARN,YARN由RM和NM进程组成!
        
        
六、hadoop的配置文件
        hadoop安装后,hadoop的性能和表现取决于用户的配置!
        
        4个默认的配置文件:
                位置:  HADOOP_HOME/share/xxxx.jar/xxx-default.xml
                core-default.xml: 设置hadoop最核心的参数!
                hdfs-default.xml   保存的是hdfs相关的参数!
                
                mapred-default.xml: MR程序在运行时,需要使用的参数!
                yarn-default.xml: yarn在启动时,需要的参数!
        
        4个用户可以自定义的配置文件: xxx-site.xml
                core-site.xml: 用户自定义的设置hadoop最核心的参数!
                hdfs-site.xml   用户自定义的保存的是hdfs相关的参数!
                
                mapred-site.xml: 用户自定义的MR程序在运行时,需要使用的参数!
                yarn-site.xml: 用户自定义的yarn在启动时,需要的参数!
        
        用户自定义的配置文件,可以覆盖默认配置文件中同名的参数的值!
        
        Hadoop在启动时,先加载4个默认的配置文件,再加载用户自定义的配置文件,如果用户自定义的配置文件
        中有和4个默认配置文件中门的参数,可以覆盖之前已经加载的值!

七、在使用hadoop命令时
        可以自定义配置文件的目录:  hadoop --config 配置文件的目录
        如果没有配置,默认读取  HADOOP_HOME/etc/hadoop 中对应的配置文件!
        
        hadoop-daemon.sh start namenode脚本在执行时,只会去默认的目录中读取配置文件!

Hadoop的安装配置(一)的更多相关文章

  1. Hadoop单机安装配置过程:

    1. 首先安装JDK,必须是sun公司的jdk,最好1.6版本以上. 最后java –version 查看成功与否. 注意配置/etc/profile文件,在其后面加上下面几句: export JAV ...

  2. Hadoop简单安装配置

    Hadoop开始设计以Linux平台为运行目标,所以这里推荐在Linux发行版比如Ubuntu进行安装,目前已经有Hadoop for Windows出来,大家自行搜下文章. Hadoop运行模式分为 ...

  3. Hadoop详细安装配置过程

    步骤一:基础环境搭建 1.下载并安装ubuntukylin-15.10-desktop-amd64.iso 2.安装ssh sudo apt-get install openssh-server op ...

  4. Hadoop HA- zookeeper安装配置

    安装集群 1.1 虚拟机: 3台安装好JDK的centos Linux虚拟机 1.2 安装包: 把下载好的zookeeper安装包,官网:http://mirror.bit.edu.cn/apache ...

  5. 【大数据】Hadoop单机安装配置

    1.解压缩hadoop-2.7.6.tar.gz到/home/hadoop/Soft目录中 2.创建软链接,方便hadoop升级  ln -s /home/hadoop/Soft/hadoop-2.7 ...

  6. hadoop搭建杂记:Linux下hadoop的安装配置

    VirtualBox搭建伪分布式模式:hadoop的下载与配置 VirtualBox搭建伪分布式模式:hadoop的下载与配置 由于个人机子略渣,无法部署XWindow环境,直接用的Shell来操作, ...

  7. hadoop的安装配置

    资源下载路径:https://archive.cloudera.com/cdh5/cdh/5/:https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0 ...

  8. Docker Hadoop LAMP安装配置教程

    以下教程来自九章算法. 1.How to install Dockerhttps://bupt.quip.com/YehSAR4qnGqB 2.How to set up hadoop environ ...

  9. Hadoop 单机安装配置

随机推荐

  1. Android蓝牙扫码连接时,防止Activity重启

    集成了一个蓝牙的扫码枪,发现每次连接时,应用的当前Activity会销毁再次创建.调试了下, 没有监听到任何的事件,非常困惑.搜了一阵了解到是Android的一个机制. 某些设备配置可能会在运行时发生 ...

  2. [error]subprocess.CalledProcessError: Command '['which', 'g++']' returned non-zero exit status 1.

    ubuntu 20.04 上安装 mmcv-full 时,无论是执行: pip install mmcv-full 还是将 mmcv-full 项目克隆下来编译,均会出现问题. 百度无果,去必应上逛了 ...

  3. 「Excel实用技巧」拿下这个报表工具,轻松给报表加水印!

    水印报表是什么?怎么给excel表格加水印? 许多时候,为了防止报表被盗.保护信息安全和保护版权,采用水印能够有效实现该需求.水印是为了防止报表被盗.进行真伪鉴别.版权保护等,而在报表中添加半透明的图 ...

  4. 思迈特软件 Smartbi数据查询能力如何?

    随着对BI应用程度的加深,用户需要连接和管理的数据越来越多,也越来越复杂. Smartbi支持丰富的数据源接入,但一般并不能直接使用接入的业务库直接进行数据分析.所以在报表开发前的取数过程,把需要的数 ...

  5. 简单的html js node 前端直接使用反向代理软件

    先放上已经打包好的地址 https://gitee.com/Amengxiaoya/node-proxy.git  切记 proxyConfig.json 设置代理 ip为自己的ipv4地址 (cmd ...

  6. Python:Scrapy(二) 实例分析与总结、写一个爬虫的一般步骤

    学习自:Scrapy爬虫框架教程(二)-- 爬取豆瓣电影TOP250 - 知乎 Python Scrapy 爬虫框架实例(一) - Blue·Sky - 博客园 1.声明Item 爬虫爬取的目标是从非 ...

  7. burpsuite中文乱码问题

    无法显示中文 先查看网页编码 然后在修改编码为网页的编码一致并重启burpsuite即可(或者直接选第一项自动识别编码) 显示中文正常,但是无法匹配中文 找到了一处验证码漏洞,想用burpsuite的 ...

  8. COS 音视频实践 | 数据工作流助你播放多清晰度视频

    前言 你是否遇到过这样的场景: 兴致勃勃地观看心爱的视频,正当到了激动人心的高潮部分,却突然因为网速过差被迫陷入"转圈圈"的人生以及社会的大思考中. 又或者是身为网速畅通无阻的vi ...

  9. MySQL[练习|面试题]-我的租房网

    1 # 创建数据库 2 CREATE DATABASE Tenement; 3 4 # 切换数据库 5 USE Tenement; 6 # 创建客户信息表 sys_user 7 CREATE TABL ...

  10. JZ-033-丑数

    丑数 题目描述 把只包含质因子2.3和5的数称作丑数(Ugly Number).例如6.8都是丑数,但14不是,因为它包含质因子7. 习惯上我们把1当做是第一个丑数.求按从小到大的顺序的第N个丑数. ...