(以下所有文件:点此链接

里面还有安装的视频教学,我这里是亲测了一次,如有报错请看红色部分。实践高于理论啊兄弟们!!)

CentOS6.4版本:

一.安装CentOS 6.4 在VMWare虚拟机上,我设置的用户是hadoop,密码是hadoop;

二.安装完成后以root用户进入,密码还是之前设的密码hadoop。

配置网络:右键右上角符号,

Edit Connections

选择Edit

要想填这个,打开windows的命令行(直接win+R,输入cmd),输入ipconfig,查看无线局域网适配器的iPv4地址,子网掩码和默认网关,并填写到虚拟机的相对应位置(注意,ipv4的地址不能一样,最好改的就差一位就好),并虚拟机的DNS servers 输入8.8.8.8,8.8.4.4,Search domains输入4.4.4.4:(输入完后点击Apply,再点击close就可以了)

完成后桌面右键open int terminal,输入service network restart,显示下图时就完成了

打开Windows的命令行,输入ping (之前填的ipv4地址),ping通就成功了。

P.S.注意,关于网络配置这一部分,每次换一个网络环境就要重来一次,因为ipv4的地址会随着你的网络环境而变换。

error:我”service network restart“这里没成功:

解决方式:在terminal中输入以下命令行:

你会看见一直出现RTNETLINK answers: File exists。不用管他,输入service network restart,就成功了。

error:我又没ping通。。

1.设置虚拟机为桥接模式

VM -> Settings -> Network Adapter: Bridged

2.配置虚拟机的ip等信息

 修改ip: gedit /etc/sysconfig/network-scripts/ifcfg-eth0
# Advanced Micro Devices [AMD] 79c970 [PCnet32 LANCE]
DEVICE=eth0
BOOTPROTO=static
IPADDR=10.128.192.213 (主机ip:10.128.192.212)
NETMASK=255.255.192.0 (子网掩码同主机)
GATEWAY=10.128.192.1 (网关同主机)
BROADCAST=192.168.16.113
HWADDR=:0C::C9:0A:
ONBOOT=yes 重启服务 /etc/init.d/network restart
关闭Linux防火墙 chkconfig iptables off
关闭虚拟机的selinux: gedit /etc/selinux/config    //把SELINUX=enforcing改为SELINUX=disabled 关闭windows防火墙(控制面板里)
关闭所有windows的杀毒软件(如果所有配置都做了,仍然不通,把杀毒软件关了试试)

三.后面的过程我们用一个工具,SecureCRT来完成。

连接过程如下图:

连接以后需要输入密码。

后面是一系列的命令行:

关闭防火墙:service iptables stop

chkconfig iptables off

vim /etc/selinux/config      //把SELINUX=enforcing改为SELINUX=disabled ,需要输入时按i,退出保存是先按esc按钮,然后:wq!

修改主机名:vim /etc/sysconfig/network  //把HOSTNAME改为hadoop

修改映射关系:vim /etc/hosts  //添加一行 10.128.197.213  hadoop(注意,中间不是一个空格,是一个tab)

重启机器:reboot

(这里重启完了以后虚拟机会重启,再从虚拟机登录进去后再用secureCRT连接)
P.S.有一个编译器叫gedit,如果是桌面安装的话可以直接用 gedit xxxx 命令,可以直接在文本上进行修改
P.S.这里重启后出错了,解决:点此链接 配置ssh: 
ssh-keygen -t rsa  //四个回车键
ssh-copy-id 10.128.197.213
ssh 10.128.197.213 //此时不需要输入密码说明配置成功
CentOS7版本:
1.安装CentOS7
这里需要注意一下,和6.4版本不同,中间会有需要选择的地方。可以选择在安装过程中配置好网络,安装源。软件选择默认是最小安装,即不安装桌面环境。如果要安装桌面需要选择gnome桌面。 后面部分不分centos版本:
配置jdk:
创建文件夹(这个步骤实际上可以直接在虚拟机上手动完成,不一定要输入命令行):

cd /home

rm -r hadoop  //删除home下的hadoop文件夹

mkdir softwares  //创建软件文件夹

mkdir data  //创建数据文件夹

mkdir tools  //创建放包的文件夹(注意,这三个文件夹都是在home目录下的)

rpm -qa|grep jdk  //查看系统是否自带jdk

rpm -qa|grep java  //还是在查看系统是否自带java

yum install -y lrzsz  //安装一个上传下载的插件(实际上这个没必要,直接从Windows里拖拽进去就好了,或者安装一个软件WinSCP                     

tar -zxf jdk-8u151-linux-x64.tar.gz -C ../software  //将jdk的包解压到software文件夹中   
//顺便说一句,jdk的包真的很长,自己打特别不科学,你先写一个jdk然后按tab键就可以全部出来!!!很方便的有木有亲~ cd /home/software/jdk1..0_151/ //进入jdk安装路径 pwd //找到安装路径,复制 vim /etc/profile //打开这个文件夹,加入:(注意啊,这两行后面部分千万不要加空格,否则就会报bash: export: `=': not a valid identifier 这个错)
export JAVA_HOME=/home/software/jdk1.8.0_151
export HADOOP_HOME=/home/software/hadoop-2.6.5
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin source /etc/profile //保存执行
java -version //检查是否java安装成功,下面出现版本号就是安装成功了

sudo权限配置:给hadoop用户也添加权限(注意,我此时还是root权限,如果不是root权限输入命令行 su,切换至root权限)

chmod u+w /etc/sudoers    //添加文件的写权限
vim /etc/sudoers

(中间是tab不是空格)

至此,hadoop的前置环境就配完了,接下来我们配hadoop环境。

打开Hadoop官网:http://hadoop.apache.org/,按照下面两个图片,进入Hadoop 2.6.5 的伪分布式安装配置中(注意,如果你要自己下载hadoop的安装包,请安装tar.gz结尾的那个,那个是有配置的,而不是src.tar.gz结尾的,无配置版本还要配置,时间花费很多)

         

同样,解压包到software里
tar -zxf /home/tools/hadoop-2.6..tar.gz -C /home/software/
tar -zxf /home/tools/protobuf-2.5..tar.gz -C /home/software/
tar -zxf /home/tools/apache-maven-3.0.-bin.tar.gz -C /home/software/
tar -zxf /home/tools/findbugs-1.3..tar.gz -C /home/software/

配置maven,findbugs环境路径:类似于上面的jdk配置,记得source重置,查看完成与否:mvn -v,findbugs -version

配置protobuf:

进入protobuf下:
cd /home/software/protobuf-2.5./
./configure
安装依赖:
yum -y install autoconf automake libtool cmake ncurses-devel openssl-devel lzo-devel zlib-devel gcc gcc-c++ 再进入protobuf,重新configure一下
./configure
make install

error:使用yum时报错:Cannot find a valid baseurl for repo

解决方式:Cannot find a valid baseurl for repo: base

我在这篇博文里详细写了各种网搜的解决方法

下面就是配置Hadoop的各种配置文件了,这里推荐一个工具,notepad++,添加一个插件NppFTP.dll,远程连接虚拟机。安装包:点此链接

使用方法:点击上排最右边的按钮

右边出现工具栏

选择Profile settings,填写内容(自己的配置):

点击连接:

如果连接不上,一种可能是没联网,一种可能是网络变动换ip地址了,虚拟机终端ifconfig查看IP地址

进入hadoop的安装目录,首先是etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/software/jdk1..0_151

然后是etc/hadoop/core-site.xml:(创建文件夹/home/software/hadoop-2.6.5/data/tmp)

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/software/hadoop-2.6.5/data/tmp</value>
</property>
</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

etc/hadoop/mapred-site.xml:(文件夹下原名mapred-site.xml.template,把名字改一下)

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

etc/hadoop/yarn-site.xml:

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

进入hadoop安装目录:

bin/hdfs namenode -format
sbin/start-dfs.sh
sbin/start-yarn.sh

输入命令行jps,查看几个运行(正常有6个)

如果不用hadoop,关闭进程:

sbin/stop-dfs.sh
sbin/stop-yarn.sh

error:bash: jps: command not found

解决:

cd
vim .bash_profile 里面path地方改成:
PATH=$PATH:$HOME/bin:/home/software/jdk1..0_151/bin source .bash_profile

P.S.Linux中含有两个重要的文件 /etc/profile和.bash_profile 每当系统登陆时都要读取这两个文件,用来初始化系统所用到的变量,其中/etc/profile是超级用户所用,.bash_profile是每个用户自己独立的,我们可以修改该文件来设置一些变量。

实际上后来一直还是打不开,我也不知道为什么,总是找不到jps。两种方法,第一种就是找不到就source .bash_profile,第二种是进入jdk的安装目录,进入bin文件夹,打开终端,运行./jps。亲测可用。

至此,CentOS6.4下Hadoop 2.6.5的所有配置就完毕了。

error:后来改了配置以后,nodemanager消失了,这是改了配置以后会出现的问题。那么先stop两个sh,再重新format了以后再start就ok了。

CentOS 6.4 配置 Hadoop 2.6.5的更多相关文章

  1. Centos 6.x 配置hadoop的环境变量

    1.安装jdk 原来是用的rpm安装的1.7,所以先使用rpm -qa|grep jdk,找到安装的1.7后 rpm -e --nodeps xxx.使用securecrt把官网下载的jdk-8u18 ...

  2. CentOS 配置hadoop

    Hadoop是用作处理大数据用的,核心是HDFS.Map/Reduce.虽然目前工作中不需要使用这个,但是,技多不压身,经过虚拟机很多遍的尝试,终于将Hadoop2.5.2的环境顺利搭建起来了.    ...

  3. CentOS安装配置Hadoop 1.2.1(伪分布模式)

    CentOS安装配置Hadoop1.2.1 1.下载安装文件 下载2个安装文件 JAVA环境:jdk-6u21-linux-i586.bin Hadoop环境:hadoop-1.2.1.tar.gz ...

  4. Linux环境安装Eclipse及配置hadoop插件

    摘要:第一次使用hadoop,另外eclipse也不太熟悉,所以把自己在安装过程中得琐碎记录下来.以备以后查看. 硬软件环境: ▪ 虚拟机: VMware Workstation 11.0.0 bui ...

  5. CentOS的网络配置(终端环境)

    在虚拟机中安装了Server版的CentOS,用于做Hadoop相关的实验.Server版的CentOS默认是没有桌面环境的,eth0的网络默认也没有开启,需要我们手动启动网络. 关键配置说明 网络和 ...

  6. 集群安装配置Hadoop具体图解

    集群安装配置Hadoop 集群节点:node4.node5.node6.node7.node8. 详细架构: node4 Namenode,secondnamenode,jobtracker node ...

  7. centos 4.4配置使用 and Nutch搜索引擎(第1期)_ Nutch简介及安装

    centos 4.4配置使用 1.Nutch简介 Nutch是一个由Java实现的,开放源代码(open-source)的web搜索引擎.主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的 ...

  8. Mac配置Hadoop最详细过程

    Mac配置Hadoop最详细过程 原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...

  9. CentOS 6.5配置SSH免密码登录

    centos 系统对权限的设置非常微妙,如果权限设置大了则ssh 拒绝,如果权限小了,则ssh 更是被拒绝(我曾经配置好久没有打通,就是因为权限过大的原因) 参考链接:http://www.linux ...

随机推荐

  1. display 的 32 种写法

    从大的分类来讲, display的 32种写法可以分为 6个大类,再加上 1个全局类,一共是 7大类: 外部值 内部值 列表值 属性值 显示值 混合值 全局值 外部值 所谓外部值,就是说这些值只会直接 ...

  2. Visual Studio 2017 Enterprise 发布 15.4 版本,离线安装包百度网盘下载。

    Visual Studio 2017 于2017年10月13日发布 15.4 版本.该版本包含多项生产力改进,支持 .NET Standard 2.0 ,并且可以开启 Xamarin Live Pla ...

  3. C#委托与事件--后续补充

    委托.事件补充 针对昨天文章 委托:让方法可以跟简单对象一样作为参数进行传递,也就是将方法作为参数进行封装. 方法:本质就是代码段 其实也好理解,目的就是为了封装,多态,既然简单对象如int i可以做 ...

  4. Spring boot 整合redis单机版

       一.安装redis 这个不多说,网上有各种系统安装redis的操作, redis安装 二.创建sprigboot项目 这个也不多说,不会的前面有相关教程. 三.添加maven坐标 四.编写spr ...

  5. 2道acm简单题(2010):1.猜数字游戏;2.字符串提取数字并求和;

    //第一题是猜数字的游戏.//题目:随即产生一个3位的正整数,让你进行猜数字,//如果猜小了,输出:"猜小了,请继续".//如果猜大了,输出:"猜大了,请继续" ...

  6. qt 使用msvc编译器出现乱码如何解决?字符串中存在空格?

    开发环境: 1.win7 64位 2.qt版本 windows-x86-msvc2015-5.9.0 如何解决? 1.设置qt文件编码 设置 默认UTF-8 如果编码是 UTF-8 则添加. 2.使用 ...

  7. JPA实体的常用注解

    @Entity 标注于实体类上,通常和@Table是结合使用的,代表是该类是实体类@Table 标注于实体类上,表示该类映射到数据库中的表,没有指定名称的话就表示与数据库中表名为该类的简单类名的表名相 ...

  8. vue项目中遇到的问题

    在 export defaul new Router({ )} 这个路由配置中一定要加mode : 'history' 否者就会在路由前面默认添加# 路由跳转的几种方式: 在VUE中使用less来编译 ...

  9. GET与POST请求的区别

    Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE.URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而HTTP ...

  10. shell脚本 sed工具

    sed工具概述(流式编辑器)非交互,基于模式匹配过滤及修改文本逐行处理,并将结果输出到屏幕可实现对文本的输出,增,删,改,查等各种操作 sed流控制:!:取反操作,根据定址条件取反n:读下一行,产生隔 ...