hadoop常见错误解决方法

一、启动集群时

　　1.节点启动失败

　　1.1端口占用　　

1.1报错信息：address already in use - bind Address:50070

解决步骤：

查询端口占用：lsof -i:50070

查询到占用端口的进程：pid

杀死进程：kill -9 {pid}

　　1.2找不到路径

1.2报错信息(namenode)：could not find dir:xxx -> 找不到namenode格式化产生的路径

格式化：hdfs namenode -format

每次格式化时都会产生新的集群id -> clusterID

/home/bigdata/hadoop/data/dfs/name/current/VERSION

　　1.3子节点启动失败

1.3报错信息(datanode)：

/home/bigdata/hadoop/data/dfs/dn/current/VERSION

删除之前遗留的信息：dn

手动修改VERSION中的版本信息，使得一致

jps发现进程已经没有，但是重新启动集群，提示进程已经开启。原因是在linux的根目录下/tmp目录中存在启动的进程临时文件，将集群相关进程删除掉，再重新启动集群。

　　1.4连接失败

1.4要求输入密码

slaves -> dfs.sh、yarn.sh -> 配置免密码登录(包括启动脚本的机器)
-------------------------------------------------------------->若namenode也为datanode，启动DataNode时也会使用ssh免密登录方式开启节点

1.5进程启动成功 -> 消失

datanode,nodeManager -> logs -> retry:8032 -> shutdown
启动时用22号端口启动----->访问主节点被防火墙拦截----->尝试一定次数自动杀死进程

防火墙

二、HDFS操作　　

1.1报错信息：permission denied -> 权限不足

　　(1)伪装用户(启动hdfs进程的用户) 
　　　　　　-------> 配置环境变量HADOOP_HOME ,HADOOP_USER_NAME
　　　　　　------->System.setProperty("hadoop.home",""); ~~ JAVA代码中设置

　　(2)hdfs-site.xml -> 关闭权限校验

1.2报错信息：无法建立通信 -> 8020

    保证hdfs进程启动，查看防火漆

三、运行MR时

1.1日志位置:

(1)web的管理界面 （8088，job名点开）

(2)$HADOOP_HOME/logs/userlogs -> 三个日志文件

1.2报错信息(远程调用执行)

(1)权限不足    　　　　　　中间结果的临时目录无相关权限 -> hdfs dfs -chmod -R 777 /tmp

(2)结果输出目录已经存在

(3)源数据目录不存在

(4)逻辑错误

(5)accept阶段卡住不动 
　　查看队列中是否有正在运行的MR任务
　  检查resourceManager/nodeManager 的防火墙是否关闭

四、HIVE启动时

1.1日志位置:在conf中指定 -> /home/${user.home} -> hive.log
1.2报错信息
(1)parseException 　　　　解析某个配置文件(hive-site.xml)的某行/列有错误，
　　直接去目标位置修改
(2)JDBC相关异常 -> 启动过程中读取配置文件打开MySQL
　　检查相关参数
(3)MySQL数据库密码修改 -> host,user唯一确定的密码(联合主键的方式实现)
    密码验证信息存放位置在mysql.user ---> host,password,user,password_expired,权限相关
    方式一：直接修改表 -> update mysql.user set password = password('xxx') where host = 'xx' and user = 'xx'
    方式二：set password = password('root'); -> 重置密码可解决密码过期问题
    添加或修改一条连接规则:
    GRANT ALL PRIVILEGES ON *.* to 'user'@'host' IDENTIFIED by 'root' WITH GRANT OPTION;
    FLUSH PRIVILEGES;
(4)ClassNotFountException:com.mysql.jdbc.Driver
    拷贝驱动jar包至$HIVE_HOME/lib
(5)远程操作时 return code 1 （系统停止级别为1，非正常停止）
    可查看hive.log，一般是/tmp/hadoop-yarn/staging/anonymous权限不足，修改文件权限即可

HWI的页面打不开时，要导入4个jar包到指定目录下。

五、SQOOP 　　

1.错误信息(在Sqoop1.4.7中有)：

Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set correctly.

解决办法(环境变量中添加)：

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*

source .bash_profile

2.数据上传成功，hive的warehouse无法查看：

向Hive中导入数据时指定数据元(复制Hive中的hive-site.xml至sqoop的配置文件目录下)

1.Hive默认使用derby作为数据元信息存储数据库

2.在数据导入时如果不进行配置会导致在MySQL中无法正常写入数据结构信息

3.在Hive中无法查询到表的结构信息--->将hive-site.xml移动到sqoop的conf目录下

cp /home/bigdata/apache-hive-1.2.2-bin/conf/hive-site.xml /home/bigdata/sqoop-1.4.7.bin/conf/

hadoop常见错误解决方法的更多相关文章

Hbase常见错误解决方法
Hbase常见错误解决方法原文转载至:https://www.jianshu.com/p/5fd74812c56c 我是通过maven管理的依赖,直接修改maven依赖中hbase的版本就可以了 ...
Spark程序运行常见错误解决方法以及优化
转载自:http://bigdata.51cto.com/art/201704/536499.htm Spark程序运行常见错误解决方法以及优化 task倾斜原因比较多,网络io,cpu,mem都有可 ...
jack server 常见错误解决方法【转】
本文转载自:https://blog.csdn.net/qq_27061049/article/details/70156200 jack 服务常见错误解决方法当你编译Android时,你不需要修改 ...
Tomcat安装教程及常见错误解决方法
目录 Tomcat安装教程及常见错误解决方法一.安装前准备 ·熟悉自己电脑的操作系统版本(32位or64位) ·保证电脑上已经装好JDK,并且已经设置好环境变量. 二.Tomcat安装教程(以Tom ...
C#常见错误解决方法
1.能提供Visual Studio开发工具包吗? 解决方法: Visual Studio 2017开发环境下载地址: https://www.visualstudio.com/zh-hans/dow ...
maven 常见错误解决方法
1. 最重要的一点,使用国内镜像,比如 oschina.net 的镜像: 搜 jar 推荐:http://maven.outofmemory.cn/,速度极快. 2. 错误:Could not res ...
File already exists: filesystem '/path/file', transaction svn常见错误解决方法
前言多人任务基本都会用到SVN,于是提交的时候如果不先更新在提交或者操作顺序不对,会经常出现错误,其中File already exists: filesystem这个就是个常见问题,上网找了半天没 ...
用Rvm安装Ruby，Rails运行环境及常见错误解决方法
一.安装Rvm 1.下载安装Rvm $ curl -L https://get.rvm.io | bash -s stable 此时可能出现错误:"gpg: 无法检查签名:找不到公钥&quo ...
maven编译常见错误解决方法整理
程序包com.sun.xml.internal.ws.spi不存在当maven项目里面有用到JDK内部的一些类,接口(如:com.sun.xml.internal.ws.spi.ProviderIm ...

随机推荐

jQuery 表单元素取值与赋值方法总结
一.普通文本框的赋值与取值 1.1.1赋值 <h2>jQuery 表单元素取值与赋值方法总结</h2> <input type="text" clas ...
activiti获取到流程图节点信息之任务节点
//获取bpmnModel对象 BpmnModel model1 = new BpmnJsonConverter().convertToBpmnModel(modelNode); //由于我们这里仅仅 ...
Web | JavaScript的引用数据类型强制转换类型
我在这里主要的想提下的是JavaScript中的引用类型进行强制转换类型.因为对于基本数据类型的变换大多都是雷同的,很容易熟知,但是引用数据类型有一点小插曲. JavaScript的引用类型主要为对象 ...
C++练习 | 运算符重载练习
#include <iostream> #include <cmath> #include <cstring> #include <iomanip> u ...
Python编程Message: CGI script is not executable ('/cgi-bin/xxxxx.py')
Message: CGI script is not executable ('/cgi-bin/xxxxx.py'). 今天在练习python服务器端编程时遇到了这个错误,查阅一番最终解决系统为l ...
java 字节流文件复制方法总结
1.使用字节流每次读写单个字节 public static void main(String[] args) throws IOException { FileInputStream fis = ne ...
Bootstrap01
Bootstrap01内容概要一.使用Bootstrap的步骤 1.下载Bootstrap类库,包含三个部分,fonts,css,Bootstrap 2.导入项目中,在头部引入JQ,css和Boot ...
数据结构09—— 并查集（Union-Find）
一.关于并查集并查集(Union-Find)是一种树型的数据结构,常用于处理一些不相交集合(Disjoint Sets)的合并及查询问题.并查集(Union-Find)从名字可以看出,主要它涉及两种 ...
[修正] Firemonkey Android 文字斜粗体显示不全的问题
问题:Firemonkey Android 平台显示斜粗体文字时,文字右方会有显示不全的问题. 修正代码: 请将 FMX.FontGlyphs.Android.pas 复制到自己的工程目录下,再修改如 ...
GCC编译器基础入门
导语 GCC(GNU Compiler Collection,GNU 编译器套件) 是由 GNU 开发的编程语言编译器,支持C.C++.Objective-C.Fortran.Java.Ada和Go语 ...

hadoop常见错误解决方法

hadoop常见错误解决方法的更多相关文章

随机推荐

热门专题