hadoop简介和环境

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求，可以以流的形式访问（streaming access）文件系统中的数据。
Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

环境准备（建议使用centos7）：
1.关闭ipv6

# vi /etc/sysctl.conf

插入下列并保存退出

net.ipv6.conf.all.disable_ipv6=1
net.ipv6.conf.default.disable_ipv6=1

# sysctl -p

2.修改主机名

# hostnamectl set-hostname master.hadoop

3.关闭firewall 或者 iptables

# systemctl stop iptables

# systemctl stop firewalld

4.关闭selinux

修改配置文件为以下（重启生效）

#vi/etc/selinuc/config

SELINUX=disabled

5.安装jdk

yum install java-1.8.0-openjdk.x86_64

6.增加用户，配置权限

#useradd hadoop

增加sudo权限
hadoop ALL=(ALL) ALL

7.配置ssh信任
1.生成公钥私钥
$ ssh-keygen -t rsa -f ~/.ssh/id_rsa 指定秘钥类型目录名字

Generating public/private rsa key pair.

Created directory '/home/hadoop/.ssh'.

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /home/hadoop/.ssh/id_rsa. 私钥

Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub. 公钥

The key fingerprint is:

38:95:cf:a6:78:37:ea:77:3a:20:a1:13:db:3f:2a:72 hadoop@master.hadoop

The key's randomart image is:

2.将公钥拷贝到/home/hadoop/.ssh/authorized_key 中

#cat /home/hadoop/.ssh/id_rsa.pub>>/home/hadoop/.ssh/authorized_key
设定权限

#chmod 600 ~/.ssh/authorized_key

3.修改stricthostkeychecking 参数

StrictHostKeyChecking"如果设为"yes"，ssh将不会自动把计算机的密匙加入"$HOME/.ssh/known_hosts"文件，且一旦计算机的密匙发生了变化，就拒绝连接。

可以修改全局变量 vi /etc/ssh/ssh_config
在这里设置 StrictHostKeyChecking no

也可以只修改用户的ssh环境
新建 ~/.ssh/config
Host 0.0.0.0
StrictHostKeyChecking no

最后改下权限

chmod 600 ~/.ssh/config

hadoop简介和环境的更多相关文章

Hadoop：Hadoop简介及环境配置
http://blog.csdn.net/pipisorry/article/details/51243805 Hadoop简介下次写上... 皮皮blog 配置hadoop环境可能出现的问题每次 ...
Hadoop生态圈-HUE环境部署
Hadoop生态圈-HUE环境部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HUE简介 1>.HUE的由来 HUE全称是HadoopUser Experienc ...
Hadoop简介与分布式安装
Hadoop的基本概念和分布式安装: Hadoop 简介 Hadoop 是Apache Lucene创始人道格·卡丁(Doug Cutting)创建的,Lucene是一个应用广泛的文本搜索库,Hado ...
【转】Hadoop HDFS分布式环境搭建
原文地址 http://blog.sina.com.cn/s/blog_7060fb5a0101cson.html Hadoop HDFS分布式环境搭建最近选择给大家介绍Hadoop HDFS系统 ...
第三章：Hadoop简介及配置Hadoop-1.2.1，hbase-0.94.13集群
前面给大家讲了怎么安装Hadoop,肯定会有人还是很迷茫,装完以后原来就是这个样子,但是怎么用,下面,先给大家讲下Hadoop简介:大致理解下就OK了 hadoop是一个平台,提供了庞大的存储和并行计 ...
批量部署Hadoop集群环境（1）
批量部署Hadoop集群环境(1) 1. 项目简介: 前言:云火的一塌糊涂,加上自大二就跟随一位教授做大数据项目,所以很早就产生了兴趣,随着知识的积累,虚拟机已经不能满足了,这次在服务器上以生产环境来 ...
Redis入门很简单之一【简介与环境搭建】
Redis入门很简单之一[简介与环境搭建] 博客分类: NoSQL/Redis/MongoDB redisnosqlmemcached缓存中间件 [Redis简介] <一>. NoSQL ...
java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式大数据概念大数据概论大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
基于Eclipse的Hadoop应用开发环境配置
基于Eclipse的Hadoop应用开发环境配置我的开发环境: 操作系统ubuntu11.10 单机模式 Hadoop版本:hadoop-0.20.1 Eclipse版本:eclipse-java- ...

随机推荐

vnpy源码阅读学习(4)：自己写一个类似vnpy的UI框架
自己写一个类似vnpy的界面框架概述通过之前3次对vnpy的界面代码的研究,我们去模仿做一个vn.py的大框架.巩固一下PyQt5的学习. 这部分的代码相对来说没有难度和深度,基本上就是把PyQt ...
dp-01背包问题（升级）
The story happened long long ago. One day, Cao Cao made a special order called "Chicken Rib&quo ...
设置java启动项目
1,
问题记录---关于posiition脱离文档流及vue中this.$route信息
1.关于position:fixed会脱离文档流简单例子: 原型有三个div盒子: 将剥box1设置为position:fixed后从上图可以看出:box1脱离了文档流,且层级显示优先于正常文档, ...
C# 调用word进程操作文档关闭进程
C# 调用word进程操作文档关闭进程作者:Jesai 时间:2018-02-12 20:36:23 前言: office办公软件作为现在主流的一款办公软件,在我们的日常生活和日常工作里面几乎每天都 ...
__new__ 方法
1.构造方法实例化过程:构造->初始化构成方法必须要有返回值,返回给初始化方法的self class A: def __init__(self): self.x = 1 print('ini ...
12.方法重载overload
方法重载:overload 重载就是在一个类中,有相同的函数名称,但形参不同的函数方法重载的规则: 方法名称必须相同参数列表必须不同(个数不同.或类型不同.参数排列顺序不同等) 方法的返回值类型可 ...
机器学习-K最近邻算法
一.介绍二.编程练习一(K最近邻算法在单分类任务的应用): import numpy as np #导入科学计算包import matplotlib.pyplot as plt #导入画图工具fr ...
go--->共享内存和通信两种并发模式原理探究
共享内存和通信两种并发模式原理探究并发理解人类发明计算机编程的本质目的是为了什么呢?毫无疑问是为了解决人类社会中的各种负责业务场景问题.ok,有了这个出发点,那么想象一下,比如你既可以一心一意只做 ...
httpClient爬虫
package httpClient.client; import java.io.File; import java.io.IOException; import java.io.InputStre ...

hadoop简介和环境

hadoop简介和环境的更多相关文章

随机推荐

热门专题