Hadoop的安装配置(一)
一、Hadoop的安装
①Hadoop运行的前提是本机已经安装了JDK,配置JAVA_HOME变量
②在Hadoop中启动多种不同类型的进程
例如NN,DN,RM,NM,这些进程需要进行通信!
在通信时,常用主机名进行通信!
在192.168.6.100机器上的DN进程,希望访问192.168.6.104机器的NN进程!
需要在集群的每台机器上,配置集群中所有机器的host映射!
配置:
Linux: /etc/hosts
Windows: C:\Windows\System32\drivers\etc\hosts
不配报错:
DNS映射异常,HOST映射异常
③注意权限
hadoop框架在运行需要产生很多数据(日志),数据的保存目录,必须让当前启动hadoop进程的用户拥有写权限!
④关闭防火墙,设置开机不自启动
service iptables stop
chkconfig iptables off
二、使用普通用户操作
①创建普通用户atguigu
useradd atguigu
②为atgugiu用户设置密码
passwd atguigu
③赋予atguigu用户root权限
vim /etc/sudoers
④将/opt目录下创建的soft目录和module目录的所属主修改为atguigu
chown -R atguigu:atguigu /opt/soft /opt/module
三、hadoop的目录介绍
bin: 使用Hdfs和运算MR时,常用的目录!
常用hadoop命令!
sbin: 管理员启动和停止集群使用的命令!
etc: hadoop配置文件所在的目录
四、使用HDFS
完成大数据的存储!
HDFS(hadoop distributed filesystem)
HDFS的运行模式:
取决于参数: fs.defaultFS=file:///(默认)
fs.defaultFS在core-default.xml中!
①本地模式(在本机上使用HDFS,使用的就是本机的文件系统)
fs.defaultFS=file:///
②分布式模式
要使用的文件系统是一个分布式的文件系统!
一个分布式的文件系统,必须由NN,DN等若干进程共同运行完成文件系统的读写操作!
fs.defaultFS=hdfs://
启动NN: hadoop-daemon.sh start namenode
停止NN: hadoop-daemon.sh stop namenode
启动DN: hadoop-daemon.sh start datanode
停止DN: hadoop-daemon.sh stop datanode
使用: hadoop fs 命令 文件路径
五、运行MapReduce
完成大数据的计算!
①按照MR的规范编写一个程序
②将程序打包为jar
③运行jar中的程序
两种运行模式:
取决于参数: mapreduce.framework.name=local(默认)
①本地模式(在本机上运行MR) mapreduce.framework.name=local
在本机运行MR!在本机使用多线程的方式,运行多个Task!
②在YARN上运行 mapreduce.framework.name=yarn
将MR提交给YARN,由YARN将Job中的多个task分配到多台机器中,启动container运行task!
需要启动YARN,YARN由RM和NM进程组成!
六、hadoop的配置文件
hadoop安装后,hadoop的性能和表现取决于用户的配置!
4个默认的配置文件:
位置: HADOOP_HOME/share/xxxx.jar/xxx-default.xml
core-default.xml: 设置hadoop最核心的参数!
hdfs-default.xml 保存的是hdfs相关的参数!
mapred-default.xml: MR程序在运行时,需要使用的参数!
yarn-default.xml: yarn在启动时,需要的参数!
4个用户可以自定义的配置文件: xxx-site.xml
core-site.xml: 用户自定义的设置hadoop最核心的参数!
hdfs-site.xml 用户自定义的保存的是hdfs相关的参数!
mapred-site.xml: 用户自定义的MR程序在运行时,需要使用的参数!
yarn-site.xml: 用户自定义的yarn在启动时,需要的参数!
用户自定义的配置文件,可以覆盖默认配置文件中同名的参数的值!
Hadoop在启动时,先加载4个默认的配置文件,再加载用户自定义的配置文件,如果用户自定义的配置文件
中有和4个默认配置文件中门的参数,可以覆盖之前已经加载的值!
七、在使用hadoop命令时
可以自定义配置文件的目录: hadoop --config 配置文件的目录
如果没有配置,默认读取 HADOOP_HOME/etc/hadoop 中对应的配置文件!
hadoop-daemon.sh start namenode脚本在执行时,只会去默认的目录中读取配置文件!
Hadoop的安装配置(一)的更多相关文章
- Hadoop单机安装配置过程:
1. 首先安装JDK,必须是sun公司的jdk,最好1.6版本以上. 最后java –version 查看成功与否. 注意配置/etc/profile文件,在其后面加上下面几句: export JAV ...
- Hadoop简单安装配置
Hadoop开始设计以Linux平台为运行目标,所以这里推荐在Linux发行版比如Ubuntu进行安装,目前已经有Hadoop for Windows出来,大家自行搜下文章. Hadoop运行模式分为 ...
- Hadoop详细安装配置过程
步骤一:基础环境搭建 1.下载并安装ubuntukylin-15.10-desktop-amd64.iso 2.安装ssh sudo apt-get install openssh-server op ...
- Hadoop HA- zookeeper安装配置
安装集群 1.1 虚拟机: 3台安装好JDK的centos Linux虚拟机 1.2 安装包: 把下载好的zookeeper安装包,官网:http://mirror.bit.edu.cn/apache ...
- 【大数据】Hadoop单机安装配置
1.解压缩hadoop-2.7.6.tar.gz到/home/hadoop/Soft目录中 2.创建软链接,方便hadoop升级 ln -s /home/hadoop/Soft/hadoop-2.7 ...
- hadoop搭建杂记:Linux下hadoop的安装配置
VirtualBox搭建伪分布式模式:hadoop的下载与配置 VirtualBox搭建伪分布式模式:hadoop的下载与配置 由于个人机子略渣,无法部署XWindow环境,直接用的Shell来操作, ...
- hadoop的安装配置
资源下载路径:https://archive.cloudera.com/cdh5/cdh/5/:https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0 ...
- Docker Hadoop LAMP安装配置教程
以下教程来自九章算法. 1.How to install Dockerhttps://bupt.quip.com/YehSAR4qnGqB 2.How to set up hadoop environ ...
- Hadoop 单机安装配置
随机推荐
- gdb调试小技巧
1.进入gdb,需要源码,然后gdb+可执行文件,如果要看代码一起的就gdb+可执行文件+tui 2.设置参数 set args +参数 3.设置断点,可以b +行数或者b+函数名字 4.r就是一直跑 ...
- maven私有仓库从搭建到使用
因工作需要,需要搭建公司自己的私有仓库,存储自己的私有jar包,所以研究了下 一.环境准备 1.下载并安装nexus,然后启动项目,这部分攻略网上很多,而且基本上都是正确的,此处不做梳理 2.登录12 ...
- kali linux 中python2不带pip的解决方法
在使用kali2020版本时,发现pip只能安装python3的模块,没办法安装python2模块,但是我有需要用到python2来运行脚本,在此贴出解决办法 https://bootstrap.py ...
- CSRF靶场练习
实验目的 了解CSRF跨站伪造请求实验 实验原理 CSRF的原理 CSRF(Cross-site Request Forgery)是指跨站点请求伪造,也就是跨站漏洞攻击,通常用来指 WEB 网站的这一 ...
- 当TIME_WAIT状态的TCP正常挥手,收到SYN后…
摘要:今天就来讨论下这个问题,在TCP正常挥手过程中,处于TIME_WAIT状态的连接,收到相同四元组的SYN后会发生什么? 本文分享自华为云社区<在TIME_WAIT状态的TCP连接,收到SY ...
- C#中的泛型 / 泛型类 / 数组、ArrayList和List三者的区别
在C#中数组,ArrayList,List都能够存储一组对象,那么这三者到底有什么样的区别呢. 数组 数组在C#中最早出现的.在内存中是连续存储的,所以它的索引速度非常快,而且赋值与修改元素也很简单. ...
- C#中default 、base 、this关键字用法简介
C#中default关键字用法简介 default 关键字可在switch语句或泛型代码中使用.switch语句:指定默认标签.泛型代码:指定类型参数的默认值.对于引用类型为空,对于值类型为零swi ...
- Oracle数据类型简介
数值类型: 整数类型:NUMBER(m); 其中m代表的是整数数值的位数:例如NUMBER(5),表示的数值范围为:-99999~99999. 浮点类型:NUMBER(m,n); 其中m代表的是浮点型 ...
- 通过xmanager连接linux远程主机桌面
转至:https://blog.csdn.net/kadwf123/article/details/79564293 1.效果图: 远程linux桌面版主机,此处是虚拟机: 使用xmanager xb ...
- omnet++:官方文档翻译总结(二)
这一部分是官方案例介绍 1.Introduction 学习自:Introduction - OMNeT++ Technical Articles 本教程是基于Tictoc的仿真案例,这些案例我们可以在 ...