前言

Hadoop从存储上来说，是相似于冗余磁盘阵列(RAID)的存储方式。将数据分散存储并提供以提供吞吐量，它的存储系统就是HDFS（Hadoop Distuibute Fils System）。从计算上来说，它通过MapReduce模型，将大数据的计算分发到多台计算机上完毕，再将结果合并，降低计算的时间。

Hadoop适合于：

1、超大数据的计算。

2、一次写入、多次读取的模式；

3、能够跑在普通的硬件上。

Hadoop不适合：

1、低延迟的数据訪问。它是为高数据吞吐量应用优化的；

2、大量的小文件

Hadoopclient须要和namenode进行交互，而namenode中存放的是datanode的文件属性，且都是在内存中，假设小文件过多。namenode是存放不了的；

3、多用户写入，随意改动文件。

Hadoop适合于一次计算，多次读取的场景，如搜索引擎，仅仅支持随机读取不支持随机写入，如Hadoop和Lucene的集成就不能够直接集成，由于Lucene支持随机写入。

本文将从使用的角度上谈了怎样搭建Hadoop、怎样配置Hadoop、怎样验证Hadoop及在Hadoop上面运行计算。以及可能会遇到些什么样的问题。

一、Hadoop环境搭建

由于Hadoop须要在Linux运行。而且Hadoop是基于Java的，在继续进行以下的步骤之前，请确认你已经准备好Linux操作系统以及Java 6或以上版本号，而且已经正确的设置了JAVA_HOME。

1、下载Hadoop

搭建Hadpp的版本号为1.2.1 下载地址为：）、确定系统是否安装了ssh和ssh-keygey

能够通过which命令来确认

which ssh

which ssh-keygen

假设出现

/usr/bin/which: no ssh in (/usr/.....)则表示系统里面没有安装SSH服务。能够通过www.openssh.com下载安装

（2）、公布公钥证书

运行例如以下命令：

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

在~/.ssh/ 文件夹会生成id_rsa和id_rsa.pub两个文件。将id_rsa.pub复制一份在~/.ssh/文件夹下，并重命名为authorized_keys，假设是单机搭建伪分布式。此时ssh的准备工作已经完毕了，假设使用全分布式环境，那么须要将authorized_keys（或authorized_keys中的内容追加到须要无password登陆的server的~/.ssh/authorized_keys文件里）及id_rsa（或id_rsa中的内容追加到须要无password登陆的server的~/.ssh/id_rsa文件里）两个文件复制到各台分布式slave机器的“~/.ssh文件夹中”中，这样随意两台机器之间互相通过ssh訪问。都不须要输入password了。假设仅仅是复制到authorized_keys到slave机器中，就仅仅能够实现主到从的不输password訪问。

注：假设须要远程登陆的server上还没有.ssh文件夹。那么就在登陆用户的文件夹下新建.ssh文件夹，权限至少设置成744。假设.ssh文件夹下没有authorized_keys文件。也新建该文件。并将其权限设置为644。

（3）測试登陆验证

在本例中。採用的是在单机中搭建伪分布式系统，通过例如以下ssh命令尝试登陆：

ssh localhost

或

ssh 127.0.0.1

假设不再提示输入password，直接登陆成功。那么SSH登陆就设置成功了。

Hadoop入门进阶步步高（一）-环境准备的更多相关文章

Hadoop入门进阶步步高（三）-配置Hadoop
三.配置Hadoop 1.设置$HADOOP_HOME/conf/hadoop-env.sh 这个文件里设置的是Hadoop运行时须要的环境变量,在1.2.1版中共同拥有19个环境变量.例如以下: ...
Hadoop入门进阶步步高（六）-Hadoop1.x与Hadoop2的差别
六.Hadoop1.x与Hadoop2的差别 1.变更介绍 Hadoop2相比較于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了非常大的提高,Ha ...
Hadoop入门进阶步步高（五）-搭建Hadoop集群
五.搭建Hadoop集群上面的步骤,确认了单机能够运行Hadoop的伪分布运行,真正的分布式运行无非也就是多几台slave机器而已,配置方面的有一点点差别,配置起来就很easy了. 1.准备三台se ...
Hadoop入门进阶步步高（二）-文件夹介绍
二.Hadoop文件夹结构这里重点介绍几个文件夹bin.conf及lib文件夹. 1.$HADOOP_HOME/bin文件夹文件名说明 hadoop 用于运行hadoop脚本命令,被hadoop ...
Hadoop入门进阶课程3--Hadoop2.X64位环境搭建
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
Hadoop入门进阶课程13--Chukwa介绍与安装部署
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
Hadoop入门进阶课程12--Flume介绍、安装与应用案例
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
Hadoop入门进阶课程11--Sqoop介绍、安装与操作
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
Hadoop入门进阶课程10--HBase介绍、安装与应用案例
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...

随机推荐

0522 json
一.概念 json依赖于js和xml,是一种数据交换格式,json对比xml的生成和处理要更加方便.因此在许多领域,json正逐步取代xml的使用. 二.使用 1.在JS当中 json在javascr ...
[Apple开发者帐户帮助]四、管理密钥（1）创建私钥以访问服务
私钥允许您访问和验证与某些应用服务(如APN,MusicKit和DeviceCheck)的通信.您将在对该服务的请求中使用JSON Web令牌(JWT)中的私钥. 所需角色:帐户持有人或管理员. 在“ ...
Python 45 css三种引入方式以及优先级
一:css三种引入方式三种方式为:行间式 | 内联式 | 外联式行间式 1.在标签头部的style属性内 2.属性值满足的是css语法 3.属性值用key:value形式赋值,value具 ...
android view、viewgroup 事件响应拦截处理机制
文章中会用到部分网络资源,首先将原作者的链接附上. 但是还是会附上数量较大的关于此部分内容的自己的思考. ----------------------------------------------- ...
ROS-TF-新建坐标系
前言:在前面的试验中,我们分别有wolrd,turtle1和turtle2三个坐标系,并且world是turtle1和turtle2的父坐标系.现在我们来新建一个自定义坐标系,让turtle2跟着新的 ...
JavaScript变量提升及作用域
今天在知乎看前端面试题的时候,看到这样的问题,发现自己懂的真的是太少了,看了给的例子,所以写一下自己的理解. 首先放一段代码: var v= “hello JavaScript”; alert(v); ...
C#屏蔽Alt+F4，解决Alt+F4关闭窗体时对话框NO后，线程不退出问题
//1.将窗体的属性KeyPrieview设置为true //keypreview属性为true的时候,就可以响应键盘事件v //2.在窗体KeyDown事件中加如下代码 private void F ...
计算机图形学课件pdf版
为方便大家学习,我将自己计算机图形学的课件分享. 下载链接:http://pan.baidu.com/s/1kV5BW8n 密码:eqg4 注:本课件与教材配套PPT有所不同.教材配套PPT是编写教材 ...
【技术累积】【点】【sql】【15】MySQL的TEXT和SELECT问题
说明只是TEXT和SELECT两个东西相关的问题,并不是两者之间的关系. TEXT TEXT类型,大文本类型,细分起来还有BIGTEXT,TINYTEXT等: 总体而言,就是处理mysql中存储大文 ...
vue移动端Ui组件 mint-ui 使用指南
1.上啦加载下拉刷新的使用 this.$refs.loadmore.onTopLoaded(); this.$refs.loadmore.onBottomLoaded(); 上啦刷新下拉加载的动画显 ...

Hadoop入门进阶步步高（一）-环境准备

前言

一、Hadoop环境搭建

1、下载Hadoop

Hadoop入门进阶步步高（一）-环境准备的更多相关文章

随机推荐

热门专题