CDH6.3 Centos7
按照官方文档安装即可
CentOS7 上搭建 CDH(6.3.0)
官方文档:https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/install_cm_cdh.html
LZO安装:https://blog.csdn.net/lingeio/article/details/94438582
Sqoop
一共分三步
- Adding the Sqoop 1 Client
- Installing the JDBC Drivers for Sqoop 1
- 下载JDBC驱动,放到目录/var/lib/sqoop/中
- Setting HADOOP_MAPRED_HOME for Sqoop 1
- 在/etc/profile中添加环境变量HADOOP_MAPRED_HOME
export HADOOP_MAPRED_HOME=/opt/cloudera/parcels/CDH-6.3.-.cdh6.3.2.p0./bin
export PATH=$PATH:$JAVA_HOME/bin:HADOOP_MAPRED_HOME
在/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin中有mapred文件
深入分析CDH的安装目录 https://blog.csdn.net/wj1314250/article/details/86494703
hadoop管理工具---CDH的目录结构了解 https://blog.csdn.net/zzq900503/article/details/79045955
测试
sqoop list-databases --connect jdbc:mysql://localhost:3306 --username root --password 000000
oozie
报错:
WARN org.apache.oozie.command.wf.ActionStartXCommand: SERVER[node01] USER[yarn] GROUP[-] TOKEN[] APP[gmv] JOB[--oozie-oozi-W] ACTION[--oozie-oozi-W@shell-e6c8] Error starting action [shell-e6c8]. ErrorType [TRANSIENT], ErrorCode [JA009], Message [JA009: Invalid resource request! Cannot allocate containers as requested resource is greater than maximum allowed allocation. Requested resource type=[memory-mb], Requested resource=<memory:, vCores:>, maximum allowed allocation=<memory:, vCores:>, please note that maximum allowed allocation is calculated by scheduler based on maximum resource of registered NodeManagers, which might be less than configured maximum allocation=<memory:, vCores:>
原因是yarn-site.xml中的两处配置值太小了,不满足作业的申请条件
把yarn-site.xml中的两处配置加大一点:
容器内存 yarn.nodemanager.resource.memory-mb
最大容器内存 yarn.scheduler.maximum-allocation-mb
报错:
WARN org.apache.oozie.action.hadoop.ShellActionExecutor: SERVER[node01] USER[yarn] GROUP[-] TOKEN[] APP[gmv] JOB[--oozie-oozi-W] ACTION[--oozie-oozi-W@shell-9dc9] Launcher exception: output.properties data exceeds its limit []
java.io.IOException: output.properties data exceeds its limit []
at org.apache.oozie.action.hadoop.LocalFsOperations.getLocalFileContentAsString(LocalFsOperations.java:)
at org.apache.oozie.action.hadoop.LauncherAM.processActionData(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM.handleActionData(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM.run(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM$.run(LauncherAM.java:)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)
at org.apache.oozie.action.hadoop.LauncherAM.main(LauncherAM.java:)
输出大小默认是2048,在oozie-site.xml修改配置,重启
<property>
<name>oozie.action.max.output.data</name>
<value>204800</value>
</property> CDH中

CDH6.3 Centos7的更多相关文章
- CentOS7 Cloudera Manager6 完全离线安装 CDH6 集群
本文是在CentOS7.4 下进行CDH6集群的完全离线部署.CDH5集群与CDH6集群的部署区别比较大. 说明:本文内容所有操作都是在root用户下进行的. 文件下载 首先一些安装CDH6集群的必须 ...
- CentOS7部署CDH6.0.1大数据平台
Cloudera’s Distribution Including Apache Hadoop,简称“CDH”,基于Web的用户界面,支持大多数Hadoop组件,包括HDFS.MapReduce.Hi ...
- Centos7搭建CDH6.0.1(单机版)
一.前言. 学习大数据组件,最好的方式是直接参照官网.不过官网的教程也让我吃了一坑,在此记录一下.因在个人笔记本资源有限,在此安装为单机版安装 二.搭建. 1.1配置主机名 hostnamectl s ...
- CDH6离线安装
CentOS7下完全离线安装CDH6集群 CDH Linux 大数据 shareSHARE 245 浏览量 分享到微博 分享到 Twitter 分享到 QQ 本文是在CentOS7.5下进行C ...
- CDH6安装文档
1.准备工作 1.1 环境 centos7.jdk8.mysql5.7.python2.7.CDH6 1.2文件下载 1.2.1 cloudmanger地址 https://archive.cloud ...
- cloudera cdh6.3 离线安装 经典大数据平台视频教程(含网盘下载地址)
cdh6.3企业级大数据视频教程 链接:https://pan.baidu.com/s/1bLGrIwzpFQB-pQRb6KOmNg 提取码:i8h8 系统和软件版本1,操作系统:Centos7.6 ...
- CDH6.2离线安装(整理版)
1.概述 CDH,全称Cloudera's Distribution, including Apache Hadoop.是Hadoop众多分支中对应中的一种,由Cloudera维护,基于稳定版本的Ap ...
- CentOS7 上搭建 CDH(6.3.0)
这里以四台节点搭建 IP HostName OS 192.168.8.5 h5(主) CentOS 7.5 192.168.8.6 h6(从) CentOS 7.5 192.168.8.7 h7(从) ...
- ①CM+CDH6.2.0安装(全网最全)
CM+CDH6.2.0环境准备 一 虚拟机及CentOs7配置 CentOS下载地址 master(16g+80g+2cpu+2核)+2台slave(8g+60g+2cpu+2核) 1.1 打开&qu ...
随机推荐
- Milking Grid poj2185
Milking Grid POJ - 2185 时限: 3000MS 内存: 65536KB 64位IO格式: %I64d & %I64u 提交 状态 已开启划词翻译 问题描述 Eve ...
- Spring JDBCTemplate 简单使用
Spring JDBCTemplate applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8&q ...
- CSU 1548 Design road(三分查找)
题目链接:https://cn.vjudge.net/problem/142542/origin Description You need to design road from (0, 0) to ...
- mysql主从架构,IO、SQL线程运行为YES,从库没有同步数据
mysql基于binlog主从复制架构,IO.SQL线程运行为YES,从库没有同步数据 Slave_IO_Running: Yes Slave_SQL_Running: Yes Replicate_D ...
- DHCP原理
一台主机的ip地址可用通过两种方式来设置.1 手动输入:2 自动向DHCP服务器获取.手动输入会出现错误,比如输入一个已经分配的ip地址,当内网机器只有几台,十几台还可以忍受,如果是几百台呢,不可能一 ...
- 云计算openstack核心组件——keystone身份认证服务
一.Keystone介绍: keystone 是OpenStack的组件之一,用于为OpenStack家族中的其它组件成员提供统一的认证服务,包括身份验证.令牌的发放和校验.服务列表.用户 ...
- 推荐使用MarkdownPad2进行Markdown写作
笔者更推荐使用notepad++写markdown Atom也有Bug,还是Visual Studio Code好用. 去官网下载MarkdownPad2的安装包,并安装之. 如果你是Windows ...
- [LeetCode] 477. Total Hamming Distance(位操作)
传送门 Description The Hamming distance between two integers is the number of positions at which the co ...
- 001---mysql分库分表
mysql分库分表 一.整体的切分方式 1.分库分表:即数据的切分就是通过某种特定的条件,将我们存放在同一个数据库中的数据分散存放到多个数据库(主机)中,以达到分散单台设备负载的效果 2.数据的切分根 ...
- PHP开发环境搭建及开发工具
PHP服务器组件非常多有WampServer.XAMPP.AppServ.phpStudy.phpnow等. 菜鸟教程推荐: WampServer,这也是目前window平台上使用最广泛的,操作也非常 ...
