0.Mappereduce采用的是Master/Slaves模型

1.Hadoop是一个开源软件框架,支持支持大数据集的存储和处理。Apache Hadoop是存储和处理大数据的解决方案你是因为:

  (1)可扩展性。添加任意数量的节点来提高性能

  (2)可靠。尽管机器出现故障,但是仍能可靠的存储数据

  (3)高可用。尽管机器出现故障,但是Hadoop仍然能够存储数据。如果机器硬件崩溃,可以从另一个路径进行访问。

  (4)经济。

2.Hadoop的核心组件是什么?

  Hadoop是一个开源软件框架,用于分布式存储和处理大数据集。Apache Hadoop核心组件是HDFS,MapReduce和YARN

  HDFS:Hadoop分布式文件系统(HDFS)是Hadoop的主要存储系统。工作原理:存储少量的大文件而不是存储大量的小文件,即使是在硬件故障的情况下,HDFS也可以可靠的存储数据。通过并行访问提供对应用程序的高吞吐量的访问

  MapReduce:是Hadoop的数据处理层。是能够处理存储在HDFS中的大型结构化和非结构化数据的应用程序。MapReduce能够并行处理大量的数据。通过将作业划分为一组独立的子任务来进行处理,MapReduce的工作阶段可以分为Map阶段和Reduce阶段

  YARN:资源调度框架。提供资源管理并允许多个数据引擎处理。

3.Hadoop的特点。

  (1)开源。

  (2)分布式处理:因为HDFS以分布式的方式在整个集群上存储数据,所以MapReduce在集群上是并行的处理数据

  (3)可靠性:尽管机器出现故障,但是仍然能够在集群上可靠的存储数据

  (4)高可用性:尽管硬件出现故障,我们能够从另一路径访问数据

  (5)可扩展性:可以将新硬件添加带节点上

  (6)经济

  (7)易于使用

4.比较Hadoop和RDBMS?

 (1):架构,传统RDBMS具有ACID的属性。而Hadoop是一个计算框架,具有两个主要的组件:分布式文件系统(HDFS)和MapReduce

 (2)数据接收。RDBMS仅能狗接收结构化的数据,而hadoop能够接收结构化数据和非结构数据

 (3)传统RDBMS支持OLTP(实时数据处理),而hadoop不支持的。

5.Hadoop的运行模式有哪些?

  (1)本地模式:单节点非分布式模式运行,作为单个的java进程进行运行。

  (2)为分布式

  (3)完全分布式。

6.本地模式有哪些功能?

  hadoop作为单个java进程以单节点非分布式模式来运行,使用本地文件系统进行相关的输入和输出。仅在测试和调试的时候比较有用

7.伪分布模式有哪些特点?

等同于完全分布式,但是所有的节点都运行在一个节点上

  配置core-site.xml文件:  

<?xml version="1.0"?>      
<!-- core-site.xml -->
<configuration>
<property>
<name>fs.defaultFS</name>   //这个地方配置类默认的文件系统,如果是本地模式就是localhost,使用的主机名和端口,最常用的是9000
<value>hdfs://localhost/</value>
</property>
</configuration>

  配置hddfs-site.xml文件

  

<?xml version="1.0"?>
<!-- hdfs-site.xml -->
<configuration>
<property>
<name>dfs.replication</name>
<value></value> //查看配置的副本数
</property>
</configuration>

  配置mapreduce  

<configuration>
<property>
<name>mapreduce.framework.name</name>  //为MapReduce指定框架名称
<value>yarn</value>
</property>
</configuration>

配置shuffle以及资源管理器的地址

  

<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

8.列举出hadoop中定义的最常用的InputFormat哪个是默认的        

  

hadoop面试复习笔记(1)的更多相关文章

  1. [Other]面试复习笔记:线程与进程复习

    基本概念 1. 进程的基本概念 线程(thread)是进程(processes)中某个单一顺序的控制流,也被称为轻量进程(lightweight processes).进程是表示资源分配的基本单位,又 ...

  2. Java秋招面试复习大纲(二):Spring全家桶+MyBatis+MongDB+微服务

    前言 对于那些想面试高级 Java 岗位的同学来说,除了算法属于比较「天方夜谭」的题目外,剩下针对实际工作的题目就属于真正的本事了,热门技术的细节和难点成为了面试时主要考察的内容. 这里说「天方夜谭」 ...

  3. Hadoop入门学习笔记---part4

    紧接着<Hadoop入门学习笔记---part3>中的继续了解如何用java在程序中操作HDFS. 众所周知,对文件的操作无非是创建,查看,下载,删除.下面我们就开始应用java程序进行操 ...

  4. Hadoop入门学习笔记---part3

    2015年元旦,好好学习,天天向上.良好的开端是成功的一半,任何学习都不能中断,只有坚持才会出结果.继续学习Hadoop.冰冻三尺,非一日之寒! 经过Hadoop的伪分布集群环境的搭建,基本对Hado ...

  5. Hadoop入门学习笔记---part2

    在<Hadoop入门学习笔记---part1>中感觉自己虽然总结的比较详细,但是始终感觉有点凌乱.不够系统化,不够简洁.经过自己的推敲和总结,现在在此处概括性的总结一下,认为在准备搭建ha ...

  6. Hadoop入门学习笔记---part1

    随着毕业设计的进行,大学四年正式进入尾声.任你玩四年的大学的最后一次作业最后在激烈的选题中尘埃落定.无论选择了怎样的选题,无论最后的结果是怎样的,对于大学里面的这最后一份作业,也希望自己能够尽心尽力, ...

  7. Java基础复习笔记系列 九 网络编程

    Java基础复习笔记系列之 网络编程 学习资料参考: 1.http://www.icoolxue.com/ 2. 1.网络编程的基础概念. TCP/IP协议:Socket编程:IP地址. 中国和美国之 ...

  8. Java基础复习笔记系列 八 多线程编程

    Java基础复习笔记系列之 多线程编程 参考地址: http://blog.csdn.net/xuweilinjijis/article/details/8878649 今天的故事,让我们从上面这个图 ...

  9. Java基础复习笔记系列 七 IO操作

    Java基础复习笔记系列之 IO操作 我们说的出入,都是站在程序的角度来说的.FileInputStream是读入数据.?????? 1.流是什么东西? 这章的理解的关键是:形象思维.一个管道插入了一 ...

随机推荐

  1. vue 移动端的开发

    一:cli 的安装: cnpm install -g @vue/cli默认是安装在如下目录:C:\Users\xiaocj\AppData\Roaming\npm\node_modules\@vue ...

  2. java 从txt文本中随机获取名字

    代码: /* 获取随机文件文字 */ public static String random(String path) {//路径 String name = null; try { //把文本文件中 ...

  3. Spring Data概览

    总结:JpaRepository继承PagingAndSortingRepository,PagingAndSortingRepository继承CrudRespository,CrudResposi ...

  4. 一款兼容性较强的H5播放器-Mediaelementjs

    特别提示:本人博客部分有参考网络其他博客,但均是本人亲手编写过并验证通过.如发现博客有错误,请及时提出以免误导其他人,谢谢!欢迎转载,但记得标明文章出处:http://www.cnblogs.com/ ...

  5. 【转】Java压缩和解压文件工具类ZipUtil

    特别提示:本人博客部分有参考网络其他博客,但均是本人亲手编写过并验证通过.如发现博客有错误,请及时提出以免误导其他人,谢谢!欢迎转载,但记得标明文章出处:http://www.cnblogs.com/ ...

  6. UVa679 小球下落(树)

    UVa679 小球下落(树) 题目大意 小球从一棵所有叶子深度相同的二叉树的顶点开始向下落,树开始所有节点都为0.若小球落到节点为0的则往左落,否则向右落.并且小球会改变它经过的节点,0变1,1变0. ...

  7. LinuxGPIO中文文档

    本文来自Linux官方文档英文版,由于需要使用Linux的GPIO进行实验,我翻译了这篇文档. 本文档描述了GPIO框架的使用者接口.注意它描述了新的基于描述符的接口. 不推荐使用的基于整数的GPIO ...

  8. React之生命周期函数

    1.新增知识点 /* https://reactjs.org/docs/react-component.html React生命周期函数: 组件加载之前,组件加载完成,以及组件更新数据,组件销毁. 触 ...

  9. nodejs之express路由与动态路由

    1.快速创建express项目步骤 /** * 1.cd 到项目里面 * 2.npm init --yes 创建package.json文件 * 3.安装express * npm install e ...

  10. Prism学习--实现可插拔的模块

    首先,在使用Prism框架加载的程序集中分别添加一个类,并让这些类实现IModule接口.当Prism框架加载某个程序集后,将首先在程序集中搜索实现了该接口的类.之后将会调用该接口的Initializ ...