AWS EMR上搭建HBase环境
0. 概述
AWS的EMR服务为客户提供的托管 Hadoop 框架可以让您轻松、快
速、经济高效地在多个动态可扩展的 Amazon EC2 实例之间分发和处理
大量数据。您还可以运行其他常用的分发框架(例如 Amazon EMR 中的
Spark 和 Presto)与其他 AWS 数据存储服务(例如 Amazon S3 和
靠地处理大数据使用案例,包括日志分析、Web 索引、数据仓库、机器
学习、财务分析、科学模拟和生物信息。
通过EMR服务,我们不必再去手动一个个的安装JDK,Hadoop,
不用再为安装这些软件费神,搭建过Hadoop集群的人都知道,很繁琐,
还有很多配置,甚至每台机器上遇到的问题还不一样。现在有了EMR一切
都变得简单,使你专注于自己的开发,现在说起来简单,但我在用EMR的
时候也遇到了很多问题,由于众所周知的原因AWS在朝鲜和其他国家并
不能方便的应用,尤其EMR,所以我能找到的关于EMR的资料没有帮我
完全搞定,官方的文档很多,但有的问题没有说清楚,在和AWS技术支
持沟通后才搞定。
1. 创建密钥对
密钥对是用来ssh登录远程主机的
1 打开 Amazon EC2 控制台 https://console.aws.amazon.com/ec2/。
2 左侧找到密钥对
3 创建密钥对
点击创建后会弹出对话框让你保存密钥,保存好,ssh登录的时候会用到
2. 创建S3存储桶
如果此步忽略,后面会默认创建一个存储桶
1 通过以下网址打开 Amazon S3 控制台:https://console.aws.amazon.com/s3/。
2 创建存储桶
3. 创建EMR,托管Hadoop集群
1 通过以下网址打开 Amazon EMR 控制台:https://console.aws.amazon.com/elasticmapreduce/。
2 创建集群
输入集群名称,设置S3存储路径,即为第二步里创建的S3存储桶,如果没有创建,这里会自动分配一个路径
选择Hbase
设置集群数量,默认即可
选择密钥对,就是在第一步里创建的密钥对,然后点击创建,则开始启动集群,知道集群状态显示为等待状态时说明启动成功
这样Hadoop集群就创建好了,在集群列表里点击刚才创建好的集群,进行集群详细信息
4. 登陆主机
根据官方文档,就是让你直接用主节点共有DNS和密钥对登陆,但是它没有说明要设置安全组,于是我在这个地方折腾了很久
1 修改安全策略
AWS为了安全,默认的安全组里禁用了SSH的22端口,也禁用ping,总之你要用到的端口都必须自己去打开,我为了省事,因为是测试,所以全部打开了端口,具体操作如下:
在集群详细信息里,找到主机点的安全组,点击后面的连接进入安全组设置
点击入站,这里就是所有开放的端口,这里可以设置具体哪个IP访问,点击编辑,新增你的安全规则
打开ICMP是为了能ping同主机,打开SSH 22端口是为了SSH登录,也是为什么创建好主机直接登录不成功的原因所在,因为我要用程序通过thrift服务器来连接HBase所以打开TCP的端口,为安全起见,建议用到什么端口就打开什么端口
2 登录
PuTTY 本身不支持 Amazon EC2 生成的私有密钥格式 (.pem)。PuTTY 有一个名为 PuTTYgen 的工具,可将密钥转换成所需的 PuTTY 格式 (.ppk)。您必须将私有密钥转换为此格式 (.ppk),然后才能尝试使用 PuTTY 连接到您的实例。
转换您的私有密钥
- 启动 PuTTYgen(例如,在“Start”菜单中,依次单击“All Programs > PuTTY > PuTTYgen ”)。
- 在 Type of key to generate (要生成的密钥类型) 下,选择 SSH-2 RSA。
- 单击“Load”。在默认情况下,PuTTYgen 仅显示扩展名为 .ppk 的文件。要找到您的 .pem 文件,请选 择显示所有类型的文件的选项。
- 为启动实例时指定的密钥对选择 .pem 文件,然后单击 Open。单击 OK (确定) 关闭确认对话框。
- 单击 Save private key (保存私有密钥),以 PuTTY 可用的格式保存密钥。PuTTYgen 显示一条关于在没有口令的情况下保存密钥的警告。单击 Yes (是)。
然后通过生成的ppk密钥来登录
登录成功:
输入hbase shell即可操作hbase
EMR默认已经开启thrift,所以不再手动去启动它,这样程序里就可以访问主机了
用程序连接的时候可以用主机公共DNS名称连接即可。
AWS EMR上搭建HBase环境的更多相关文章
- 在AWS EMR上运行Map Reduce的Java示例程序 及 操作小计
下面的代码中AffairClient类中包含了三个内之类,分别对应于Hadoop Mapreduce程序运行所需的Mapper类,Reducer类,和主类.AffairClient类中其余方法用于配置 ...
- Linux 下搭建 HBase 环境
Linux 下搭建 HBase 环境 作者:Grey 原文地址: 博客园:Linux 下搭建 HBase 环境 CSDN:Linux 下搭建 HBase 环境 前置工作 首先,需要先完成 Linux ...
- Ubuntu上搭建Hadoop环境(单机模式+伪分布模式) (转载)
Hadoop在处理海量数据分析方面具有独天优势.今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下. 首先,了解Hadoop的三种安装模式: 1. 单机模式. 单机模式 ...
- CentOS7.2上搭建httpbin环境
CentOS7上搭建httpbin环境 1.安装python31)安装python3.6可能使用的依赖yum -y install openssl-devel bzip2-devel expat-de ...
- windows上搭建php环境
在Windows 7下进行PHP环境搭建,首先需要下载PHP代码包和Apache与Mysql的安装软件包. PHP版本:php-5.3.2-Win32-VC6-x86,VC9是专门为IIS定制的,VC ...
- 在ubuntu16上搭建rabbitMQ环境
在ubuntu16上搭建rabbitMQ环境 安装rabbitMQ apt-cache pkgnames | grep rabbitmq apt-get install rabbitmq-server ...
- 使用Cloudera Manager搭建HBase环境
使用Cloudera Manager搭建HBase环境 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用CM安装HBase服务 1>.进入CM服务安装向导 2>. ...
- mac上搭建mysql环境配置和Navicat连接mysql
mac上搭建mysql环境配置 1.下载mysql for mac: https://downloads.mysql.com/archives/community/ 注意:mysql版本要和你的MAC ...
- 【FastDFS】小伙伴们说在CentOS 8服务器上搭建FastDFS环境总报错?
写在前面 在[冰河技术]微信公众号的[分布式存储]专题中,我们分别搭建了单节点FastDFS环境和高可用FastDFS集群环境.但是,之前的环境都是基于CentOS 6.8服务器进行搭建的.很多小伙伴 ...
随机推荐
- 关于margin-top的一些特别问题
当给子元素添加了margin-top的数值,浏览器解析的时候默认添加到父元素上解决的方法: 1 给父元素添加一个上边框border-top. 2 或者给子元素加个浮动. 3 给父元素添加overfl ...
- 新的一年新的变化!IT的大变天
今天是一个特别的日子,祝女神朋友们,节日快乐,早点下班! 新的一年,大家又忙碌在加班加点的堆代码中,bug的陪伴使我快乐使我忧伤,想想想,也奋斗了五六百的岁月,实习期向往大城市的公司,梦想着有一天与自 ...
- 【Luogu1919】 A*B Problem升级版(FFT)
题面戳我 题解 把每个数都直接看做一个多项式,每一位就是一项 现在求用FFT求出卷积 然后考虑一下进位就可以啦 #include<iostream> #include<cstdio& ...
- html学习第一弹の常用标签的归类
HTML初步学习: 行内元素:只占据他对应标签的边框所包含的空间,默认横向排布. 块级元素:块级元素占据其父元素(容器)的整个空间,因此创建了一个块,通常浏览器会在块级元素前后另起一行,默认竖向排布. ...
- 为 Debian 8 或 Debian 9(64 位)安装 .NET Core
在 Debian 8 或 Debian 9(64 位)上安装 .NET Core 的具体步骤: 备注:必须有用户控制目录,才能通过 tar.gz 在 Linux 系统上进行安装. 1.准备一台刚安装的 ...
- 【Unity与23种设计模式】观察者模式(Observer)
GoF中定义: "在对象之间定义一个一对多的连接方法,当一个对象变换状态时,其他关联的对象都会自动收到通知." 现实中,社交网络就是个例子. 以前的报社,每次出新刊的时候, 报刊便 ...
- TLA+和并发系统正确性验证
TLA+介绍 TLA+(WIKI,官网)是一门领域特定语言,主要用于数理逻辑计算和并发系统的正确性验证.TLA+中的TLA代表的是"行为时序逻辑(Temporal Logic of Acti ...
- wpf动态增加删除控件
我在xaml中定义了一个名字为morepictureWrapPan为WrapPanel,然后将控件添加在此WrapPanel中.由于要实现控件的删除功能,所以增加的textbox和button的名字都 ...
- python爬微信公众号前10篇历史文章(3)-lxml&xpath初探
理解lxml以及xpath 什么是lxml? python中用来处理XML和HTML的library.与其他相比,它能提供很好的性能, 并且它支持XPath. 具体可以查看官方文档->http: ...
- 快速搭建CentOS+ASP.NET Core环境支持WebSocket
环境:CentOS 7.x,.net core 2 以下.net core 2安装操作为官方方法.如果你使用Docker,那么更简单了,只需要docker pull microsoft/dotnet就 ...