跨集群拷贝hdfs

拷贝 A集群的test目录到B集群的test目录

问题1： cause:java.io.IOException: Failed to run job : User root cannot submit applications to queue root.default

原因：权限问题

解决：账号权限问题，切换为创建该文件的用户账号，或提供当前用户权限。

问题2：拒接连接

原因：可能端口号不同引起的，查看端口号与使用协议是否匹配

hadoop distcp hdfs://master:8020/test/

hadoop distcp hftp://master:50070/test/

hadoop distcp webhdfs://master:50070/test/

问题3：java.net.UnknowHostException 集群A 的hdfs路径至集群B的hdfs路径

原因：若直接使用ip，则集群B的host地址书写错误，查看ip与端口号；若使用hostName，则hosts文件未配置。

解决:A集群的hosts文件添加B集群的所有host与ip的映射；

B集群添加A集群的所有host与ip的映射，使用hostName均添加。

问题4：Java.net.SocketTimeoutException: connect timed out

原因：日志显示连接超时，用的是hftp协议拷贝，需要连接A集群master 的50070端口，而此时连接超时，说明相关权限未开通。或者是hosts文件配置host与ip错误

解决:联系运维开通B集群到A集群所有namenode 的50070端口的防火墙。如果防火墙开通了，还是出现此问题，可以修改A集群的ip tables，将B集群的所有机器加入ip tables。问题5： map 100%之后连接超时Java.net.SocketTimeoutException: connect timed out

原因：map 100% 完成，说明数据读取完毕，写入目标集群失败。

解决：开通B集群到A集群所有datanode的http相关端口（默认为50075）。

跨集群拷贝hdfs的更多相关文章

Hadoop 跨集群访问
[原文地址] 跨集群访问发表于 2015-06-01 | 简单总结下跨集群访问的多种方式. 跨集群访问HDFS 直接给出HDFS URI 我们平常执行hadoop fs -ls /之类的操作 ...
中国联通改造 Apache DolphinScheduler 资源中心，实现计费环境跨集群调用与数据脚本一站式访问
截止2022年,中国联通用户规模达到4.6亿,占据了全中国人口的30%,随着5G的推广普及,运营商IT系统普遍面临着海量用户.海量话单.多样化业务.组网模式等一系列变革的冲击. 当前,联通每天处理话单 ...
Hadoop跨集群迁移数据（整理版）
1. 什么是DistCp DistCp(分布式拷贝)是用于大规模集群内部和集群之间拷贝的工具.它使用Map/Reduce实现文件分发,错误处理和恢复,以及报告生成.它把文件和目录的列表作为map任务的 ...
Hive跨集群迁移
Hive跨集群迁移数据工作是会出现的事情, 其中涉及到数据迁移, metastore迁移, hive版本升级等. 1. 迁移hdfs数据至新集群hadoop distcp -skipcrccheck ...
Hadoop集群(二) HDFS搭建
HDFS只是Hadoop最基本的一个服务,很多其他服务,都是基于HDFS展开的.所以部署一个HDFS集群,是很核心的一个动作,也是大数据平台的开始. 安装Hadoop集群,首先需要有Zookeeper ...
实现Kubernetes跨集群服务应用的高可用
在Kubernetes 1.3版本,我们希望降低跨集群跨地区服务部署相关的管理和运营难度.本文介绍如何实现此目标. 注意:虽然本文示例使用谷歌容器引擎(GKE)来提供Kubernetes集群,您可以在 ...
SqlServer跨集群升级
SqlServer跨集群升级 1.新Server的IP要和旧的在同一网段. 2.安装SQL SERVER(注意:排序要和以前的一样,更改TempDB位置) 3.开启防火墙,并打开1433和5022端口 ...
Elasticsearch跨集群搜索(Cross Cluster Search)
1.简介 Elasticsearch在5.3版本中引入了Cross Cluster Search(CCS 跨集群搜索)功能,用来替换掉要被废弃的Tribe Node.类似Tribe Node,Cros ...
格式化hdfs后，hadoop集群启动hdfs，namenode启动成功，datanode未启动
集群格式化hdfs后,在主节点运行启动hdfs后,发现namenode启动了,而datanode没有启动,在其他节点上jps后没有datanode进程!原因: 当我们使用hdfs namenode - ...

随机推荐

Percona-Tookit工具包之pt-table-usage
Preface There always be some table join operations in our SQL statement.Although we can know ...
ironic images
参考: http://blog.csdn.net/wanghuiict/article/details/52757359 ironic 整个部署流程中有两组映像,分别是 deploy 映像和 user ...
makefile规则整理
makefile规则整理实际开发中,makefile改的多,写的少. 为了后面不要在编译链接这种地方花费太多的时间,在这里系统性的整理其规则: 基本格式 TARGET : PREREQUISITES ...
shell之进程
ps System V 风格 - -elF -ef -eF BSD a所有跟终端有关的进程 ...
win10&hyper上装Ubuntu出现没有找到dev fd0, sector 0 错误
win10 hyper装 ubuntu blk_update_request:I/O error,dev sr0,sector0 错误配置好安装重启后出现 blk_update_request: I ...
201621123034 《Java程序设计》第10周学习总结
作业10-异常 1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结异常相关内容. 2. 书面作业本次PTA作业题集异常 1. 常用异常结合题集题目7-1回答 1.1 自己以前编写 ...
IIS7 无法显示 htm js 图片 css的问题
中文:开始->控件面板->程序->打开或关闭windows功能->Internet信息服务->万维网服务->常见http功能->静态内容(选中) englis ...
babelrc配置
{ "presets": [ ["env", { // webapck2/3必须配置,放弃使用babel的模块化,使用webpack的模块化,webpack1不 ...
linux设置永久别名
http://blog.csdn.net/miltonzhong/article/details/48089415
nginx配置C compiler cc is not found
1.需求 linux安装个编译器参考资料:http://blog.csdn.net/testcs_dn/article/details/51461750

跨集群拷贝hdfs

跨集群拷贝hdfs的更多相关文章

随机推荐

热门专题