Hadoop入门--HDFS（单节点）配置和部署 (一)

一配置SSH

下载ssh服务端和客户端
- sudo apt-get install openssh-server openssh-client
验证是否安装成功
- ssh username@192.168.30.128
- 按照提示输入username的密码，回车后显示以下，则成功。(此处不建议修改端口号，hadoop默认的是22,修改后启动hadoop会报异常，除非在hadoop的配置文件中也修改ssh端口号)
- Welcome to Ubuntu 13.04 (GNU/Linux 3.8.0-34-generic i686)
  * Documentation: https://help.ubuntu.com/
  
  New release '13.10' available.
  Run 'do-release-upgrade' to upgrade to it.
  
  Last login: Sun Dec 8 10:27:38 2013 from ubuntu.local
公钥-私钥登录配置（无密）
- ssh-keygen -t rsa -P ""（其中会出现输入提示，回车即可，之后home/username/.ssh/ 下生成id_rsa ，id_rsa.pub， known_hosts三个文件。
  /home/username/ 下生成 authorized_keys 文件）
将id_rsa.pub追加到authorized_keys授权文件中
- cat .ssh/id_rsa >> authorized_keys （切换到/home/username/下）
公钥-私钥登录配置（有密）
- ssh-keygen -t rsa （在出现 Enter passphrase (empty for no passphrase):
  时，输入设置的密码。其它同上，此处未测试过）

二安装JDK（采用OpenJDK，为啥不用JDK...百度or谷歌）

下载jdk
- sudo apt-get install openjdk-7-jdk（目前最新的是openjdk-7）
配置环境变量
- sudo vim ～/.bashrc
- （在文件末尾添加） export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk-i386
     export JRE_HOME=${JAVA_HOME}/jre
     export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
     export PATH=${JAVA_HOME}/bin:$PATH
- （修改环境变量生效）source ~/.bashrc
测试jdk是否安装成功
- java -version（出现以下信息则成功）
- java version "1.7.0_25"
  OpenJDK Runtime Environment (IcedTea 2.3.10) (7u25-2.3.10-1ubuntu0.13.04.2)
  OpenJDK Client VM (build 23.7-b01, mixed mode, sharing)

三安装Hadoop和HDFS配置

下载hadoop
- tar -zxvf hadoop-1.2.1.tar.gz（解压到 hadoop-1.2.1目录下）
- mv hadoop-1.2.1 hadoop（hadoop-1.2.1目录改名为hadoop）
- cp hadoop /usr/local（复制hadoop到 /usr/local 目录下）
配置hdfs文件（hadoop/conf/core-site.xml，hadoop/conf/hdfs-site.xml，hadoop/conf/mapred-site.xml）

sudo vim /usr/local/hadoop/conf/core-site.xml（修改为以下内容）
<?xml version="1.0"?>
   <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

   

   <configuration>
     <property>
       <name>fs.default.name</name>
       <value>hdfs://192.168.30.128:9000</value>
    </property>
</configuration>
sudo vim /usr/local/hadoop/conf/hdfs-site.xml（修改为以下内容）

<?xml version="1.0"?>
   <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

   

   <configuration>
   <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/username/hadoop_tmp</value>
       <description>A base for other temporary directories.</description>
</property>
<property>
     <name>dfs.name.dir</name>
     <value>/tmp/hadoop/dfs/datalog1,/tmp/hadoop/dfs/datalog2</value>
</property>
<property>
     <name>dfs.data.dir</name>
     <value>/tmp/hadoop/dfs/data1,/tmp/hadoop/dfs/data2</value>
</property>
<property>
     <name>dfs.replication</name>
      <value>2</value>
</property>
sudo vim /usr/local/hadoop/conf/mapred-site.xml（修改为以下内容）
<?xml version="1.0"?>
   <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

   

   <configuration>
    <property>
     <name>mapred.job.tracker</name>
     <value>192.168.30.128:9001</value>
   </property>
</configuration>

四运行wordcount

在hdfs中创建一个统计目录，输出目录不用创建，否则运行wordcount的时候报错。
./hadoop fs -mkdir /input
./hadoop fs -put myword.txt /input
./hadoop jar /usr/local/hadoop/hadoop-examples-1.2.1.jar wordcount /input /output
./hadoop fs -cat /output/part-r-00000

Hadoop入门--HDFS（单节点）配置和部署 (一)的更多相关文章

二、hdfs单节点安装
一.准备环境在配置hdfs之前,我们需要先安装好hadoop的配置,本文主要讲述hdfs单节点的安装配置. hadoop的单节点安装配置请参考:https://www.cnblogs.com/lay ...
Zookeeper+Kafka的单节点配置
Zookeeper+Kafka的单节点配置环境描述:Ubuntu16.04 server系统,在系统上搭建Java环境,jdk的版本为1.8或更高,我的服务器IP地址为192.168.0.106. ...
HDFS环境搭建（单节点配置）
[参考文章]:hadoop集群搭建(hdfs) 1. Hadoop下载官网下载地址: https://hadoop.apache.org/releases.html,进入官网根据自己需要下载具体的安 ...
CentOS7 下 Hadoop 单节点(伪分布式)部署
Hadoop 下载 (2.9.2) https://hadoop.apache.org/releases.html 准备工作关闭防火墙 (也可放行) # 停止防火墙 systemctl stop f ...
（3）hadoop单节点配置
hadopp版本hadoop-2.6.0-cdh5.7.0 下载地址http://archive-primary.cloudera.com/cdh5/cdh/5/ 同样使用flashFXP上 ...
Hbase入门教程--单节点伪分布式模式的安装与使用
Hbase入门简介 HBase是一个分布式的.面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像 ...
Hadoop HDFS 单节点部署方案
初学者,再次记录一下. 确保Java 和 Hadoop已安装完毕(每个人的不一定一样,但肯定都有数据,仅供参考) [root@jans hadoop-2.9.0]# pwd /usr/local/ha ...
hadoop单节点配置
首先按照官网的单机去配置,如果官网不行的话可以参考一下配置,这个是配置成功过的.但是不一定每次都成功 http://hadoop.apache.org/docs/r2.6.5/ centos 6.7 ...
在Ubuntu下配置运行Hadoop2.4.0单节点配置
还没有修改hosts,请先按前文修改. 还没安装java的,请按照前文配置. (1)增加用户并设立公钥: sudo addgroup hadoop sudo adduser --ingroup had ...

随机推荐

【转】Entity Framework教程
转自:http://www.cnblogs.com/xray2005/category/189491.html Entity Framework系列文章导航摘要: 本节集合了Entity Fra ...
C++中new的用法
new int;//开辟一个存放整数的存储空间,返回一个指向该存储空间的地址(即指针) new int(100);//开辟一个存放整数的空间,并指定该整数的初值为100,返回一个指向该存储空间的地址 ...
C#/.NET整数的三种强制类型转换（int）、Convert.ToInt32（）、int.Parse()的区别
这三种方式都是强制把内容转换为整数,但他们之间是有区别的,如下: 一.(int)适合简单数据类型之间的转换,C#的默认整型是int32(不支持bool型). 二.int.Parse(string sP ...
简单实现tab标签页切换
常见面试题: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...
flask request
请求对象要操作 URL (如 ?key=value )中提交的参数可以使用 args 属性:searchword = request.args.get('key', '')用户可能会改变 URL 导致 ...
性能相差极大的SQL语句
等价的SQL,性能差异极大,数据库里设计了一个字段存储日期时间,但不是datetime类型,用了时间戳(int 11), 下面有2个SQL语句用于查询数据库,一个是把时间戳转成date进行查询,一个是 ...
转:Java架构师与开发者提高效率的10个工具
原文来自于:http://www.importnew.com/14624.html Java受到全球百万计开发者的追捧,已经演变为一门出色的编程语言.最终,这门语言随着技术的变化,不断的被改善以迎合变 ...
BZOJ 1023 仙人掌图
Description 如果某个无向连通图的任意一条边至多只出现在一条简单回路(simple cycle)里,我们就称这张图为仙人图(cactus).所谓简单回路就是指在图上不重复经过任何一个顶点的回 ...
JavaScript+CSS实现经典的树形导航栏
在一些管理系统里面,一般右侧都会有树形的导航栏,点击一下就会出现下拉菜单,显示出来该父菜单下面的子菜单项目,然后配以图片,和CSS的效果,可以说是非常常用的功能,现在做一个项目,正好用到这个功能,于 ...
scheme corotuine
In cooperative multithreading, a thread must yield control manually; it will not be preemptively swi ...

Hadoop入门--HDFS（单节点）配置和部署 (一)

一 配置SSH

三 安装Hadoop和HDFS配置

四 运行wordcount

Hadoop入门--HDFS（单节点）配置和部署 (一)的更多相关文章

随机推荐

热门专题

一配置SSH

三安装Hadoop和HDFS配置

四运行wordcount