即将上线的Spark服务器面临的一系列填坑笔记

                                        作者:尹正杰

版权声明:原创作品,谢绝转载!否则将追究法律责任。

  把kafka和flume倒腾玩了,以为可以轻松一段时间了,没想到使用CDH部署的spark也出现一些列的问题,真让人脑仁疼啊,硬着头皮一个一个的去填坑..........

一.因配置文件不同,导致无权限访问hdfs目录。

报错信息如下:

18/10/19 00:36:23 ERROR spark.SparkContext: Error initializing SparkContext.
org.apache.hadoop.security.AccessControlException: Permission denied: user=root, access=WRITE, inode="/user":hdfs:supergroup:drwxr-xr-x

  综上所述,是权限问题。于是我用hdfs和hadoop命令查看了一下我的hdfs目录,发现他们是两个不同的结果:

  两个命令执行的结果不一致!这个时候我想到了配置文件,我的hdfs和yarn都是用cdh安装的,这台机器是从存储集群(还有一套计算集群)抽出来做入口机的。这个时候我想到了hdfs的配置文件可能是不同的,于是我找到下面的2个目录,对比了一下,发现果真和我猜想的一样,conf.cloudera.hdfs和conf.cloudera.yarn的配置文件是不一致的:

  根据我们的报错信息,它应该是去读取conf.cloudera.yarn这个目录的配置文件啦!因此我们需要同步hdfs的配置文件: cp conf.cloudera.hdfs/core-site.xml conf.cloudera.hdfs/hdfs-site.xml   conf.cloudera.yarn/

  本以为问题就次解决了,没想想到易燃还是在报错,虽然hdfs和hadoop命令的执行结果目前是一致的了!

  这就尴尬了,倒是是咋回事嘛?难道启动spark的时候去读hdfs文件权限的不在这个目录下?于是我差了一下关于包含hdfs配置文件的目录,不查不知道,一查吓一跳!竟然有这么多地方存放hdfs的配置文件。这Cloudera公司也真是的,为啥不公用同一个配置文件呢?算了,不吐槽了,继续去验证配置文件是否一致!

  果然是有猫腻,两个同名的配置文件,内容是不一致的 !

  于是我有屁颠屁颠的将之前的hdfs的配置文件进行同步,最终关于权限的问题就消失了。

二.因配置文件不同,导致无法访问服务

  很高兴的将上面的问题解决了,但是新的错误又出来了,报错信息如下:

18/10/19 15:51:26 ERROR spark.SparkContext: Error initializing SparkContext.
org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application master.

我的第一反应,是不是还是配置文件的问题呢?于是我去新集群,将yarn的配置文件下载下来,并上传到我这台服务器上

  将下载后的文件上传到我的服务器上并替换掉,然后在启动spark查看是否恢复

即将上线的Spark服务器面临的一系列填坑笔记的更多相关文章

  1. 即将上线的Hive服务器面临的一系列填坑笔记

    即将上线的Spark服务器面临的一系列填坑笔记 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.18/10/19 16:36:31 WARN metastore.ObjectSt ...

  2. 即将上线的YARN服务器面临的一系列填坑笔记

    即将上线的YARN服务器面临的一系列填坑笔记 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 折腾了一个星期,终于让开发将数据跑起来了,可通过yarn的webUI界面,发现这里的核心 ...

  3. 即将上线的flume服务器面临的一系列填坑笔记

      即将上线的flume服务器面临的一系列填坑笔记 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.   一.flume缺少依赖包导致启动失败! 报错信息如下: 2018-10-17 ...

  4. 即将上线的Kafka服务器面临的一系列填坑笔记

      即将上线的Kafka服务器面临的一系列填坑笔记 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Kafka日志报错:[error] k.m.j.KafkaJMX$ - Fai ...

  5. http://182.92.241.20/mypro/login 偶的点金项目细化分包管理平台即将上线!!

    http://182.92.241.20/mypro/login            偶的点金项目细化分包管理平台即将上线!! 敬请期待! 项目外包利器 项目管理利器

  6. <a href="javascript:void(0);" id='test' onclick="javascript:alert('即将上线,敬请期待!');"><em class="rmwd"></em>征稿平台</a>

    <a href="javascript:void(0);" id='test' onclick="javascript:alert('即将上线,敬请期待!');&q ...

  7. 即将上线的Kafka 集群(用CM部署的)无法使用“--bootstrap-server”进行消费,怎么破?

    即将上线的Kafka 集群(用CM部署的)无法使用“--bootstrap-server”进行消费,怎么破? 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.   一.报错:org.a ...

  8. NGK生态商城即将上线官网,推动生态落地应用

    NGK生态商城即将上线官网,以推动生态落地应用.此举意味着NGK生态将跻身区块链顶尖之列,同时,NGK代币.NGK Dapp游戏 "呼叫河马" 以及NGK DeFi项目Baccar ...

  9. 没想到即将上线的NGK生态应用这么厉害?!

    话说这即将上线的NGK公链可不是闹着玩的,这条公链的蛰伏时间长达两年,恐怕这个准备时间,连最初的区块链1.0时代的项目都无法比拟,现在的话那都差太远了. 编程一段代码并不难,难的是耐得住赚快钱的心.人 ...

随机推荐

  1. 《Gogoing》Alpha版会议总结

    一.开会的过程 首先大家对自己的任务进行了汇报,然后大家就当前最需要解决的问题提出解决方案,最后相互鼓励,相互帮助,探讨下一步该怎么做. 二.讨论的问题 百度地图API代码和界面代码为什么对接不上? ...

  2. Java web错误总结~

    1.java程序中没有错,但是项目上面显示一个红叉的解决办法 错误信息: 报Description  Resource Path Location Type Java compiler level d ...

  3. C#微信公众号开发入门教程

    首先打开开发文档: 微信公众号开发者文档:http://mp.weixin.qq.com/wiki/home/index.html 一.创建测试账号 可以先申请一个开发者测试账号

  4. Activiti动态设置办理人扩展

    关键词:Assignee.Candidate users.Candidate groups:setAssignee.taskCandidateUser.taskCandidateGroup 主要解决问 ...

  5. WorkStation 虚拟机迁移到 ESXi的后续处理.

    自己遇到了然后按照blog http://blog.sina.com.cn/s/blog_79a8b8e10102w8bm.html 解决 特此记录一下. 将Workstation的vmdk文件导入到 ...

  6. ubuntu 下搭建redis和php的redis的拓展

    系统环境: 腾讯云服务器, ubuntu16.0.4.4 ,php7.0   一.安装redis服务 sudo apt-get install redis-server 安装好的redis目录在 /e ...

  7. React 表单控件onSubmit

    <!DOCTYPE html><html><head lang="en"> <meta charset="UTF-8" ...

  8. hive 远程管理

  9. ARIMA模型识别、计算p、q值

    #-*- coding: utf-8 -*- #确定最佳p.d.q值 import pandas as pd #参数初始化 discfile = '../data/discdata_processed ...

  10. vander范德蒙德行列式

    https://baike.baidu.com/item/%E8%8C%83%E5%BE%B7%E8%92%99%E8%A1%8C%E5%88%97%E5%BC%8F function m=vande ...