需要下载的软件: 1.hadoop-2.6.4.tar.gz 下载网址:http://hadoop.apache.org/releases.html 2.scala-2.11.7.tgz 下载网址:http://www.scala-lang.org/ 3.spark-1.6.0-bin-hadoop2.6.tgz 下载网址:http://spark.apache.org/ 4.jdk-8u73-linux-x64.tar.gz 下载网址:http://www.oracle.com/technet…
Hadoop三种安装模式:单机模式,伪分布式,真正分布式 一 单机模式standalone单 机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置.在这种默认模式下所有 3个XML文件均为空.当配置文件为空时,Hadoop会完全运行在本地.因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何 Hadoop的守护进程.该模式主要用于开发调试MapReduce程序的应用逻辑. 二 伪分布模式安装tar xzvf had…
超详细!CentOS 7 + Hadoop3.0.0 搭建伪分布式集群 ps:本文的步骤已自实现过一遍,在正文部分避开了旧版教程在新版使用导致出错的内容,因此版本一致的情况下照搬执行基本不会有大错误.如果按本文步骤进行的时候出事了,可以鼠标选中博客页面右侧的目录导航看看最后一部分的意外出事的坑点解决方案. 准备linux主机环境 一.安装虚拟机 下载地址: VMware workstation 14 Pro (附:许可证秘钥) 系统iso:CentOS7 Minimal 基本上就是下一步下一步这…
操作系统:centos6.6(一台服务器) 环境:selinux disabled:iptables off:java 1.8.0_131 安装包:hadoop-2.5.0.tar.gz 伪分布式环境(适用于学习环境) 安装步骤: 1.解压安装包 # tar zxvf hadoop-2.5.0.tar.gz  -C   /data/hadoop/hadoopfake/ 2.配置hadoop参数 1)设置环境变量  #vim /etc/profile 追加下面两行: export HADOOP_H…
三台虚拟机,IP地址通过路由器静态DHCP分配 (这样就无需设置host了). 三台机器信息如下 -      1. hadoop-a: 192.168.0.20  #master     2. hadoop-b: 192.168.0.21  #slave     3. hadoop-c: 192.168.0.22  #slave CenOS 7.0, Hadoop 2.6.0 1. 设置ssh无密码登陆(略)#可参考课程PPT或者 http://my.oschina.net/u/1169607…
安装环境为 CentOS 64位系统, 大概分下面几个步奏, 0. 安装JDK1. 配置SSH2. 配置/etc/hosts3. 拷贝hadoop包到没台机器上4. 修改hadoop配置文件5. 关闭每台机器的防火墙6. 格式化namenode7. 运行hadoop 详细说每个步奏, 0. 安装jdk 下载JDK到每台机器上,解压后在.bash_profile中设置JAVA_HOME环境变量为JDK目录 1. 配置SSH hadoop是master/slaver 结构,配置SSH使得从maste…
之前读到了一篇关于配置安装hadoop的博文(地址:http://www.powerxing.com/install-hadoop/)能正确安装和运行,但是在网页进行Jobtracker监控时,输入localhost:8088(这里注意,hadoop2.0以后版本的jobtracker接口从50030变成了8088)不能访问,看了一些资料,发现是mapred-site.xml和yarn-site.xml两个配置文件没有配置. 首先是mapred-site.xml文件,这个配置文件本来没有,但是有…
1.安装JDK.在此不做解说,上篇博文里已介绍过.http://www.cnblogs.com/lifeinsmile/p/3578677.html 2.配置ssh. ssh服务,用于管理远程Hadoop守护进程. 2.1安装ssh server:$sudo apt-get install openssh-server 2.2免密码ssh的设置: $ssh-keygen –t rsa  (输入命令后一路回车即可). 2.3设置密钥授权: $ssh-keygen -t dsa -P '' -f ~…
前言: 目前,学习hadoop的目的是想配合其它两个开源软件Hbase(一种NoSQL数据库)和Nutch(开源版的搜索引擎)来搭建一个知识问答系统,Nutch从指定网站爬取数据存储在Hbase数据库的表中,而Hbase运行在Hadoop之上. 学习Hadoop已有数月,想把自己的积累晒出来,一者温故知新,二者与大家分享.写文章挺费时间的,所以文风尽量简洁.若欲了解细节可发帖讨论,交个朋友. 水平有限,还望指正! 一.使用环境 操作系统:Ubuntu12.04 Hadoop版本:1.0.4 二.…
hadoop中文镜像地址:http://mirrors.hust.edu.cn/apache/hadoop/core/hadoop-2.2.0/ 第一步,下载 wget 'http://archive.apache.org/dist/hadoop/core/hadoop-2.2.0/hadoop-2.2.0.tar.gz' 第二步,编译haoop-2.2.0(注解:这一步很费时间)因为官方下载只提供32位的,所以自己编译为64位http://blog.csdn.net/canlets/artic…