一 配置SSH

  1. 下载ssh服务端和客户端

    • sudo apt-get install openssh-server openssh-client
  2. 验证是否安装成功
    • ssh username@192.168.30.128
    • 按照提示输入username的密码,回车后显示以下,则成功。(此处不建议修改端口号,hadoop默认的是22,修改后启动hadoop会报异常,除非在hadoop的配置文件中也修改ssh端口号)
    • Welcome to Ubuntu 13.04 (GNU/Linux 3.8.0-34-generic i686)

      * Documentation:  https://help.ubuntu.com/

      New release '13.10' available.
      Run 'do-release-upgrade' to upgrade to it.

      Last login: Sun Dec  8 10:27:38 2013 from ubuntu.local

  3. 公钥-私钥登录配置(无密)
    • ssh-keygen -t rsa -P ""(其中会出现输入提示,回车即可,之后home/username/.ssh/ 下生成id_rsa ,id_rsa.pub, known_hosts三个文件。
        /home/username/ 下生成 authorized_keys 文件)
  4. 将id_rsa.pub追加到authorized_keys授权文件中
    • cat .ssh/id_rsa >> authorized_keys  (切换到/home/username/下)
  5. 公钥-私钥登录配置(有密)
    • ssh-keygen -t rsa (在出现 Enter passphrase (empty for no passphrase):
      时,输入设置的密码。其它同上,此处未测试过)

二 安装JDK(采用OpenJDK,为啥不用JDK...百度or谷歌)

  1. 下载jdk

    • sudo apt-get install openjdk-7-jdk(目前最新的是openjdk-7)
  2. 配置环境变量
    • sudo vim ~/.bashrc
    • (在文件末尾添加)  export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk-i386
         export JRE_HOME=${JAVA_HOME}/jre
         export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
         export PATH=${JAVA_HOME}/bin:$PATH
    • (修改环境变量生效)source ~/.bashrc
  3. 测试jdk是否安装成功
    • java -version(出现以下信息则成功)
    • java version "1.7.0_25"
      OpenJDK Runtime Environment (IcedTea 2.3.10) (7u25-2.3.10-1ubuntu0.13.04.2)
      OpenJDK Client VM (build 23.7-b01, mixed mode, sharing)

三 安装Hadoop和HDFS配置

  1. 下载hadoop

    • tar -zxvf  hadoop-1.2.1.tar.gz(解压到 hadoop-1.2.1目录下)
    • mv hadoop-1.2.1 hadoop(hadoop-1.2.1目录改名为hadoop)
    • cp hadoop /usr/local(复制hadoop到 /usr/local 目录下)
  2. 配置hdfs文件(hadoop/conf/core-site.xmlhadoop/conf/hdfs-site.xml,hadoop/conf/mapred-site.xml
    • sudo vim /usr/local/hadoop/conf/core-site.xml(修改为以下内容)
    • <?xml version="1.0"?>
         <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
        
         <!-- Put site-specific property overrides in this file. -->
        
         <configuration>
           <property>
             <name>fs.default.name</name>
             <value>hdfs://192.168.30.128:9000</value>
          </property>
        </configuration>
    • sudo vim /usr/local/hadoop/conf/hdfs-site.xml(修改为以下内容)
    • <?xml version="1.0"?>
         <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
        
         <!-- Put site-specific property overrides in this file. -->
        
         <configuration>
         <property>
              <name>hadoop.tmp.dir</name>
              <value>/home/username/hadoop_tmp</value><!--需要创建此目录-->
             <description>A base for other temporary directories.</description>
        </property>
        <property>
           <name>dfs.name.dir</name>
           <value>/tmp/hadoop/dfs/datalog1,/tmp/hadoop/dfs/datalog2</value>
        </property>
        <property>
           <name>dfs.data.dir</name>
           <value>/tmp/hadoop/dfs/data1,/tmp/hadoop/dfs/data2</value>
        </property>
        <property>
           <name>dfs.replication</name>
            <value>2</value>
        </property>
    • sudo vim /usr/local/hadoop/conf/mapred-site.xml(修改为以下内容)
    • <?xml version="1.0"?>
         <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
        
         <!-- Put site-specific property overrides in this file. -->
        
         <configuration>
          <property>
           <name>mapred.job.tracker</name>
           <value>192.168.30.128:9001</value>
         </property>
        </configuration>

四  运行wordcount

  1. 在hdfs中创建一个统计目录,输出目录不用创建,否则运行wordcount的时候报错。
  2. ./hadoop fs -mkdir /input
  3. ./hadoop fs -put myword.txt /input
  4. ./hadoop jar /usr/local/hadoop/hadoop-examples-1.2.1.jar wordcount /input /output
  5. ./hadoop fs -cat /output/part-r-00000

Hadoop入门--HDFS(单节点)配置和部署 (一)的更多相关文章

  1. 二、hdfs单节点安装

    一.准备环境 在配置hdfs之前,我们需要先安装好hadoop的配置,本文主要讲述hdfs单节点的安装配置. hadoop的单节点安装配置请参考:https://www.cnblogs.com/lay ...

  2. Zookeeper+Kafka的单节点配置

    Zookeeper+Kafka的单节点配置 环境描述:Ubuntu16.04 server系统,在系统上搭建Java环境,jdk的版本为1.8或更高,我的服务器IP地址为192.168.0.106. ...

  3. HDFS环境搭建(单节点配置)

    [参考文章]:hadoop集群搭建(hdfs) 1. Hadoop下载 官网下载地址: https://hadoop.apache.org/releases.html,进入官网根据自己需要下载具体的安 ...

  4. CentOS7 下 Hadoop 单节点(伪分布式)部署

    Hadoop 下载 (2.9.2) https://hadoop.apache.org/releases.html 准备工作 关闭防火墙 (也可放行) # 停止防火墙 systemctl stop f ...

  5. (3)hadoop单节点配置

    hadopp版本hadoop-2.6.0-cdh5.7.0      下载地址http://archive-primary.cloudera.com/cdh5/cdh/5/ 同样使用flashFXP上 ...

  6. Hbase入门教程--单节点伪分布式模式的安装与使用

    Hbase入门简介 HBase是一个分布式的.面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像 ...

  7. Hadoop HDFS 单节点部署方案

    初学者,再次记录一下. 确保Java 和 Hadoop已安装完毕(每个人的不一定一样,但肯定都有数据,仅供参考) [root@jans hadoop-2.9.0]# pwd /usr/local/ha ...

  8. hadoop单节点配置

    首先按照官网的单机去配置,如果官网不行的话可以参考一下配置,这个是配置成功过的.但是不一定每次都成功 http://hadoop.apache.org/docs/r2.6.5/ centos 6.7 ...

  9. 在Ubuntu下配置运行Hadoop2.4.0单节点配置

    还没有修改hosts,请先按前文修改. 还没安装java的,请按照前文配置. (1)增加用户并设立公钥: sudo addgroup hadoop sudo adduser --ingroup had ...

随机推荐

  1. 【转】Entity Framework教程

    转自:http://www.cnblogs.com/xray2005/category/189491.html   Entity Framework系列文章导航 摘要: 本节集合了Entity Fra ...

  2. C++中new的用法

    new int;//开辟一个存放整数的存储空间,返回一个指向该存储空间的地址(即指针) new int(100);//开辟一个存放整数的空间,并指定该整数的初值为100,返回一个指向该存储空间的地址 ...

  3. C#/.NET整数的三种强制类型转换(int)、Convert.ToInt32()、int.Parse()的区别

    这三种方式都是强制把内容转换为整数,但他们之间是有区别的,如下: 一.(int)适合简单数据类型之间的转换,C#的默认整型是int32(不支持bool型). 二.int.Parse(string sP ...

  4. 简单实现tab标签页切换

    常见面试题: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...

  5. flask request

    请求对象要操作 URL (如 ?key=value )中提交的参数可以使用 args 属性:searchword = request.args.get('key', '')用户可能会改变 URL 导致 ...

  6. 性能相差极大的SQL语句

    等价的SQL,性能差异极大,数据库里设计了一个字段存储日期时间,但不是datetime类型,用了时间戳(int 11), 下面有2个SQL语句用于查询数据库,一个是把时间戳转成date进行查询,一个是 ...

  7. 转:Java架构师与开发者提高效率的10个工具

    原文来自于:http://www.importnew.com/14624.html Java受到全球百万计开发者的追捧,已经演变为一门出色的编程语言.最终,这门语言随着技术的变化,不断的被改善以迎合变 ...

  8. BZOJ 1023 仙人掌图

    Description 如果某个无向连通图的任意一条边至多只出现在一条简单回路(simple cycle)里,我们就称这张图为仙人图(cactus).所谓简单回路就是指在图上不重复经过任何一个顶点的回 ...

  9. JavaScript+CSS实现经典的树形导航栏

    在一些管理系统里面,一般右侧都会有树形的导航栏,点击一下就会出现下拉菜单,显示出来该父菜单下面的子菜单 项目,然后配以图片,和CSS的效果,可以说是非常常用的功能,现在做一个项目,正好用到这个功能,于 ...

  10. scheme corotuine

    In cooperative multithreading, a thread must yield control manually; it will not be preemptively swi ...