官方文档: http://www.cloudera.com/content/cloudera/en/documentation/core/latest/

博客教程 http://www.wangyongkui.com/hadoop-cdh5/

http://www.aboutyun.com/thread-9190-1-1.html

http://www.linuxidc.com/Linux/2014-03/98842.htm

CDH(Cloudera Distribution Hadoop)

官方教程 http://www.cloudera.com/content/cloudera/en/downloads/cdh/

在线安装

网站下的one-click-install目录选择对应的Linux系统版本号,自动添加安装源和进行相关配置,然后根据机器的功能进行下面的安装

Resource Manager host :

  sudo apt-get update; sudo apt-get install hadoop-yarn-resourcemanager
NameNode host running:

  sudo apt-get install hadoop-hdfs-namenode
Secondary NameNode host (if used) running:

  sudo apt-get install hadoop-hdfs-secondarynamenode
All cluster hosts except the Resource Manager running:

  sudo apt-get install hadoop-yarn-nodemanager hadoop-hdfs-datanode hadoop-mapreduce
One host in the cluster running:

  sudo apt-get install hadoop-mapreduce-historyserver hadoop-yarn-proxyserver
All client hosts running:

  sudo apt-get install hadoop-client

详细安装说明参见 http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_ig_cdh5_install.html

离线安装

http://archive.cloudera.com/cdh5/cdh/5/ 独立功能包下载,不推荐,需要时间识别文件版本和安装到对应目录

http://archive.cloudera.com/cdh5/parcels/ 完整功能包 在Cloudera Manager中使用来部署

下载好相应系统版本的.parcel文件后,拷贝到本地的parcel源目录下(由Cloudera Manager Server指定,默认是/opt/cloudera/parcel-repo)

然后打开同目录下的mainfest.json(也要拷贝到其中)文件,从里面搜索到与你下载的包同名的部分,然后根据其hash值创建一个后缀名为.sha的文本文件,名字与下载的parcel同名,然后将sha文件也拷贝到本地parcel源的目录下。例如:

# cat > CDH-4.3.-.cdh4.3.0.p0.-el6.parcel.sha
df5cc61b2d257aaf625341f709a4f8e09754038a

总之,要确保/opt/cloudera/parcel-repo下面有三个文件:
CDH-4.3.0-1.cdh4.3.0.p0.22-el6.parcel
mainfest.json
CDH-4.3.0-1.cdh4.3.0.p0.22-el6.parcel.sha

cloudera-manager安装

离线安装文件目录http://archive.cloudera.com/cm5/cm/5/

下载tar.gz 解压

sudo tar -zxvf cloudera-manager-trusty-cm5..1_amd64.tar.gz -C /opt/cloudera

添加用户

sudo useradd --system --home=/opt/cloudera/cm-5.2./run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

配置服务器ip和端口(单机测试无须此步骤)

修改/etc/cloudera-scm-agent/config.ini 下面的 server_port 和 server_host

配置mysql数据库

从http://www.mysql.com/products/connector/下载JDBC,复制到CM目录下./share/cmf/lib

sudo cp /home/manhua/下载/mysql-connector-java-5.1.-bin.jar ./share/cmf/lib/

生成数据库

sudo apt-get install mysql-server
sudo ./share/cmf/schema/scm_prepare_database.sh mysql scm  -h localhost -u root -p root

install ssh

create no password sudo user

https://help.ubuntu.com/community/RootSudo

sudo visudo ,add the following to the END of the file

<username> ALL=NOPASSWD: ALL

由于我用的是linux mint,所以在安装时它会拒绝,需要修改lsb

sudo gedit /etc/lsb-release

DISTRIB_ID=LinuxMint
DISTRIB_RELEASE=17.1
DISTRIB_CODENAME=rebecca
DISTRIB_DESCRIPTION="Linux Mint 17.1 Rebecca"
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=14.04
DISTRIB_CODENAME=trusty
DISTRIB_DESCRIPTION="Linux Mint 17.1 Rebecca"

启动

sudo ./etc/init.d/cloudera-scm-server start

其中对于agents,scp复制CM的整个目录到相同位置后,运行

sudo ./etc/init.d/cloudera-scm-agent start

启动 Cloudera Manager 管理控制台

http://localhost:7180

用户名密码均为admin

然后用上面下载的cdh的parcel文件来安装

Cloudera的更多相关文章

  1. 免安裝、免設定的 Hadoop 開發環境 - cloudera 的 QuickStart VM

    cloudera 的 QuickStart VM,為一種免安裝.免設定 Linux 及 Hadoop,已幫你建好 CDH 5.x.Hadoop.Eclipse 的一個虛擬機環境.下載後解壓縮,可直接以 ...

  2. cloudera learning7:Hadoop资源管理

    Linux Control Groups(cgroups):在操作系统级别进行资源分配,可通过Cloudera Static Service Pools配置. YARN调度器配置:对运行在YARN上的 ...

  3. cloudera learning4:Hadoop集群规划

    涉及到一些关于硬件的东西,我也不是很懂,记录下来有待以后学习. Hadoop集群一般都是由小到大,刚开始可能只有4到6个节点,随着存储数据的增加,计算量的增大,内存需求的增加,集群慢慢变大. 比如按照 ...

  4. cloudera learning3:Hadoop配置和守护进程logs

    Services:Haddoop cluster上可以部署的组件,比如HDFS,YARN,HBase等. Roles:在service配置时,由Cloudera Manager创建.比如NameNod ...

  5. cloudera learning1:cloudera简介及安装

    cloudera分为两个部分:CDH和CM.CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera公司发布的Hadoop版本,封装了Apache Had ...

  6. 通过Cloudera在hadoop生态圈中安装Sentry服务。

    写在张文章时,差点辣死我了.把sentry数据库密码搞掉了,导致hive,impala,hue都挂了.此事要引以为戒,以后要小心操作了. 安装Sentry服务 a)                在c ...

  7. cloudera cdh native lib

    如果通过命令行的方式安装cloudera 版本的hadoop,下载它的cdh版本. 解压后执行,你会发现报warning,没有native的库,lib/native是空的. 如何获取native的文件 ...

  8. 离线安装 Cloudera ( CDH 5.x )

    要配置生产环境前,最好严格按照官方文档/说明配置环境.比如,官方说这个安装包用于RETHAT6, CENTOS6,那就要装到6的版本下,不然很容易出现各种各样的错. 配置这个CDH5我入了很多坑,最重 ...

  9. Cloudera Manager 5和CDH5离线安装

    CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Had ...

  10. 离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程

    关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloud ...

随机推荐

  1. 编码风格——linux内核开发的coding style

    总结linux内核开发的coding style, 便于以后写代码时参考. 下面只是罗列一些规则, 具体说明可以参考: 内核源码(Documentation/CodingStyle) 01 - 缩进 ...

  2. cf 816E Karen and Supermarket

    题目大意 给定\(n\)一颗树,每个点上有一个物品 每个物品有价格\(c[i]\) 有优惠券,能使价格减少\(d[i]\) 但是使用优惠券的前提时购买该物品,且父亲也使用优惠券 给定钱包余额\(lim ...

  3. Bzoj2882 工艺 [线性算法]

    后缀自动机题解 -> http://www.cnblogs.com/SilverNebula/p/6420601.html 后缀自动机敲完,看了下排行,wc为什么别人跑得这么快?……是诶,这最小 ...

  4. 【winform】基于UserControl实现webBrower组件时html页面元素加载及onclick事件监听实现

    [背景]基于System.Windows.Forms.UserControl实现的webBrower组件在html内使用window.external调用winform事件失败. [解决思路]借助wi ...

  5. CentOS下Yum使用

    1. 介绍 Yum,即Yellow dog Updater Modified,是一个基于 RPM 包管理的字符前端软件包管理器:能够从指定的服务器自动下载 RPM 包并且安装,可以处理依赖性关系,并且 ...

  6. Python学习杂记_10_三元运算符

    常用三元运算符来简化分支和循环的代码: 分支简化: a = 1b = 2c = a if a > 1 else bprint(c) # 以上几行等同于 a = 1b = 2if a >1: ...

  7. UITextView只能显示两行问题

    需求:UITextView只能显示两行 UITextView * textView = [[UITextView alloc]init]; textView.frame = CGRectMake(20 ...

  8. (2)JavaScript基础2

    一.操作符 1.一元操作符 自加自减操作符 前置型 执行前置递增和递减操作时,变量的值都是在语句被求值以前改变的 var num1 = 2; var num2 = 20; var num3 = --n ...

  9. HDU 1223 还是畅通过程【最小生成树模板】

    还是畅通工程 Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Subm ...

  10. UVA 272 TEX Quotes【字符串】

    https://vjudge.net/problem/UVA-272 [分析]:标记一下. [代码]: #include <bits/stdc++.h> using namespace s ...