Apache Hive 执行HQL语句报错 ( 10G )

# 故障描述：

hive > select substring(request_body["uuid"], -, ) as uuid, count(distinct(request_body["uuid"])) as count

from log_bftv_api

where year= and month= and day= and request_body["method"] = "bv.lau.urecommend" and length(request_body["uuid"]) =

group by

order by uuid;

# hive 执行该HQL语句时报错信息如下：( 数据量小的时候没有问题 )

# 报错信息：

MapReduce Total cumulative CPU time:  minutes  seconds  msec

Ended Job = job_1510050683827_0137 with errors

Error during job, obtaining debugging information...

Examining task ID: task_1510050683827_0137_m_000002 (and more) from job job_1510050683827_0137

Task with the most failures():

-----

Task ID:

  task_1510050683827_0137_m_000000

URL:

  http://namenode:8088/taskdetails.jsp?jobid=job_1510050683827_0137&tipid=task_1510050683827_0137_m_000000

-----

Diagnostic Messages for this Task:

Error: Java heap space

FAILED: Execution Error, return code  from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

MapReduce Jobs Launched:

Stage-Stage-: Map:   Reduce:    Cumulative CPU: 106.07 sec   HDFS Read:  HDFS Write:  FAIL

Total MapReduce CPU Time Spent:  minutes  seconds  msec

# 原因分析：

报错显示 Error: Java heap space、return code  from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

查资料说是因为内存的原因，由于HQL实际上是被转换成mapreduce的java任务，所以做了以下操作。

解决方法：

hadoop shell > vim etc/hadoop/hadoop-env.sh

# 默认

export HADOOP_HEAPSIZE=

hadoop shell > vim etc/hadoop/yarn-env.sh

# 默认

YARN_HEAPSIZE=

# 跟据实际情况，按需调整！

hadoop shell > vim etc/hadoop/mapred-site.xml

    <property>

        <name>mapreduce.map.memory.mb</name>

        <value></value>

    </property>

    <property>

        <name>mapreduce.map.java.opts</name>

        <value>-Xmx1024M</value>

    </property>

    <property>

        <name>mapreduce.reduce.memory.mb</name>

        <value></value>

    </property>

    <property>

        <name>mapreduce.reduce.java.opts</name>

        <value>-Xmx2560M</value>

    </property>

    <property>

        <name>mapreduce.task.io.sort.mb</name>

        <value></value>

    </property>

    <property>

        <name>mapreduce.task.io.sort.factor</name>

        <value></value>

    </property>

    <property>

        <name>mapreduce.reduce.shuffle.parallelcopies</name>

        <value></value>

    </property>

# 新增这些参数 ( 跟据机器实际情况，按需成倍调整 )

# 我的这个测试环境是4台8核8G的KVM虚拟机，一个NameNode，三个DataNode！

# 经过这次参数调整，目前600G的数据集上没出过问题，HDFS 上还在不断的写入历史数据、新数据。

Apache Hive 执行HQL语句报错 ( 10G )的更多相关文章

mysql5.7执行sql语句报错：In aggregated query without GROUP BY, expression #1 of SELECT list contains nonagg
mysql5.7执行sql语句报错:In aggregated query without GROUP BY, expression #1 of SELECT list contains nonagg ...
【spring boot jpa】hql语句报错：antlr.NoViableAltException: unexpected token: roleName
使用场景:在spring data jpa下使用@Query("hql语句") 然后在项目启动的时候报错 hql语句报错:antlr.NoViableAltException: u ...
解决Mysql搭建成功后执行sql语句报错以及区分大小写问题
刚搭建完mysql 8.0以后会: 一.表区分大小写, 二.执行正确的sql语句成功且会报:[Err] 1055 - Expression #1 of ORDER BY clause is not i ...
PHP执行insert语句报错“Data too long for column”解决办法
PHP执行mysql 插入语句, insert语句在Navicat for mysql(或任意的mysql管理工具) 中可以正确执行,但是用mysql_query()函数执行却报错. 错误 : “Da ...
mysqlworkbench 执行update语句报错：You are using safe update mode and you tried to update a table without a WHERE that uses a KEY column
You are using safe update mode and you tried to update a table without a WHERE that uses a KEY colum ...
Hive 执行sql命令报错
Failed with exception java.io.IOException:java.lang.IllegalArgumentException: java.net.URISyntaxExce ...
sql无效字符执行sql语句报错解决方案
以为是sql中参数赋值有问题,但是将sql语句直接copy到PLSQL中执行,却没问题,纠结了好久,原来是 insert语句多了:唉,坑爹 http://www.jb51.net/article/32 ...
SQL Server中事务transaction如果没写在try catch中，就算中间语句报错还是会提交
假如我们数据库中有两张表Person和Book Person表: CREATE TABLE [dbo].[Person]( ,) NOT NULL, ) NULL, ) NULL, [CreateTi ...
shell脚本if判断语句报错[: too many arguments的两种原因
shell脚本,if判断语句报错[: too many arguments 我遇到过两种情况: 1.第一中情况就是网上大家说的,字符串变量中可能存在空格,shell解析时将其认为是多个参数,再进行判断 ...

随机推荐

os层删除与数据库层drop的区别于对策。
os rm删除的,可以通过os层面恢复(句柄.inode.如果inode没有了可以根据block去重组出来数据文件),也可以通过rman备份还原方式恢复. db 层面drop删除的只能不完全恢复( ...
修改oracle系统参数spfile导致数据库无法启动解决
错误示范: SQL> alter system set nls_date_format='yyyy-mm-dd 24hh:mi:ss' scope=spfile;System altered.我 ...
OpenWrt的web服务器
参考: http://www.szchehang.com/news/10602.html 我们登录的路由器主界面就是通过这个软件指定了80端口来访问的.我们要添加自己额外的网站服务,那只需要重新定义一 ...
SQL群集多实例卸载、安装
安装SQL多实例群集: 准备工作:准备SQL群集管理员及服务账号:sqladmin和srv-sql,sqladmin和srv-sql都属于群集节点计算机的administrators组预留群集名称账 ...
Mysql 性能优化1 硬件设备的选择
--------------------------------------------目录------------------------------------------------- • 我们 ...
lwip编译选项
修改默认选项时,不要修改opt.h文件,通过lwipopts.h修改. 和内存管理以及TCP发送性能相关的选项 // 为1时使用系统库malloc/free进行内存管理 #ifndef MEM_LIB ...
spring boot学习(1) hello world
第一节:SpringBoot 简介主要是简化开发: 1. 创建独立的Spring应用程序 2. 嵌入的Tomcat,无需部署WAR文件 3. 简化Maven配置 4. 自动配置Spring 5. 提 ...
pycharm fiddler requests.exceptions.SSLError
一.SSL问题1.不启用fiddler,直接发https请求,不会有SSL问题(也就是说不想看到SSL问题,关掉fiddler就行) 2.启动fiddler抓包,会出现这个错误:requests.ex ...
web项目除了业务还需要关注的点
1:安全性,不允许访问外网,访问外网通过反向代理的方式. 2:安全性,和外网交互的时候,需要CA证书,基于SSL协议的证书 3:日志,生产上通常会关闭某些日志,所以,允许出现的日志就显得至关重要了. ...
[UE4]Visual Studio的相关插件安装：UE4.natvis和UnrealVS Extension
转自:http://aigo.iteye.com/blog/2281182 UE4.natvis 官方文档: https://docs.unrealengine.com/latest/INT/Prog ...

Apache Hive 执行HQL语句报错 ( 10G )

Apache Hive 执行HQL语句报错 ( 10G )的更多相关文章

随机推荐

热门专题