【原创】大叔经验分享（48）oozie中通过shell执行impala

oozie中通过shell执行impala，脚本如下：

$ cat test_impala.sh

#!/bin/sh

/usr/bin/kinit -kt /tmp/impala.keytab impala/server04

/usr/bin/impala-shell -i server04:21000 -q 'show databases'

直接执行shell脚本正常，在oozie中执行报错：

Traceback (most recent call last):

  File "/usr/lib/impala-shell/impala_shell.py", line 38, in <module>

    from impala_client import (ImpalaClient, DisconnectedException, QueryStateException,

  File "/usr/lib/impala-shell/lib/impala_client.py", line 20, in <module>

    import sasl

  File "/usr/lib/impala-shell/ext-py/sasl-0.1.1-py2.7-linux-x86_64.egg/sasl/__init__.py", line 1, in <module>

  File "/usr/lib/impala-shell/ext-py/sasl-0.1.1-py2.7-linux-x86_64.egg/sasl/saslwrapper.py", line 7, in <module>

  File "/usr/lib/impala-shell/ext-py/sasl-0.1.1-py2.7-linux-x86_64.egg/_saslwrapper.py", line 7, in <module>

  File "/usr/lib/impala-shell/ext-py/sasl-0.1.1-py2.7-linux-x86_64.egg/_saslwrapper.py", line 4, in __bootstrap__

  File "/usr/lib/impala-shell/lib/pkg_resources.py", line 874, in resource_filename

    self, resource_name

  File "/usr/lib/impala-shell/lib/pkg_resources.py", line 1349, in get_resource_filename

    self._extract_resource(manager, self._eager_to_zip(name))

  File "/usr/lib/impala-shell/lib/pkg_resources.py", line 1375, in _extract_resource

    self.egg_name, self._parts(zip_path)

  File "/usr/lib/impala-shell/lib/pkg_resources.py", line 954, in get_cache_path

    self.extraction_error()

  File "/usr/lib/impala-shell/lib/pkg_resources.py", line 920, in extraction_error

    raise err

pkg_resources.ExtractionError: Can't extract file(s) to egg cache

The following error occurred while trying to extract file(s) to the Python egg

cache:

  [Errno 13] Permission denied: '/home/.python-eggs'

The Python egg cache directory is currently set to:

  /home/.python-eggs

Perhaps your account does not have write access to this directory?  You can

change the cache directory by setting the PYTHON_EGG_CACHE environment

variable to point to an accessible directory.

Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.ShellMain], exit code [1]

按照提示修改PYTHON_EGG_CACHE即可

$ cat test_impala.sh

#!/bin/sh

export PYTHON_EGG_CACHE=/tmp/.python-eggs

/usr/bin/kinit -kt /tmp/impala.keytab impala/server04

/usr/bin/impala-shell -i server04:21000 -q 'show databases'

另外还可以通过beeline连接，则没有python的问题，

详见：https://www.cnblogs.com/barneywill/p/10296502.html

【原创】大叔经验分享（48）oozie中通过shell执行impala的更多相关文章

【原创】经验分享：一个小小emoji尽然牵扯出来这么多东西？
前言之前也分享过很多工作中踩坑的经验: 一个线上问题的思考:Eureka注册中心集群如何实现客户端请求负载及故障转移? [原创]经验分享:一个Content-Length引发的血案(almost.. ...
【原创】大叔经验分享（18）hive2.0以后通过beeline执行sql没有进度信息
一问题在hive1.2中使用hive或者beeline执行sql都有进度信息,但是升级到hive2.0以后,只有hive执行sql还有进度信息,beeline执行sql完全silence,在等待结 ...
【原创】大叔经验分享（49）hue访问hdfs报错/hue访问oozie editor页面卡住
hue中使用hue用户(hue admin)访问hdfs报错: Cannot access: /. Note: you are a Hue admin but not a HDFS superuser ...
【原创】大叔经验分享（6）Oozie如何查看提交到Yarn上的任务日志
通过oozie job id可以查看流程详细信息,命令如下: oozie job -info 0012077-180830142722522-oozie-hado-W 流程详细信息如下: Job ID ...
【原创】大叔经验分享（5）oozie提交spark任务如何添加依赖
spark任务添加依赖的方式: 1 如果是local方式运行,可以通过--jars来添加依赖: 2 如果是yarn方式运行,可以通过spark.yarn.jars来添加依赖: 这两种方式在oozie上 ...
【原创】大叔经验分享（21）yarn中查看每个应用实时占用的内存和cpu资源
在yarn中的application详情页面 http://resourcemanager/cluster/app/$applicationId 或者通过application命令 yarn appl ...
【原创】大叔经验分享（84）spark sql中设置hive.exec.max.dynamic.partitions无效
spark 2.4 spark sql中执行 set hive.exec.max.dynamic.partitions=10000; 后再执行sql依然会报错: org.apache.hadoop.h ...
【原创】大叔经验分享（71）docker容器中使用jvm工具
java应用中经常需要用到jvm工具来进行一些操作,如果java应用部署在docker容器中,如何使用jvm工具? 首先要看使用的docker镜像, 比如常用的openjdk镜像分为jdk和jre,只 ...
【原创】大叔经验分享（7）创建hive表时格式如何选择
常用格式 textfile 需要定义分隔符,占用空间大,读写效率最低,非常容易发生冲突(分隔符)的一种格式,基本上只有需要导入数据的时候才会使用,比如导入csv文件: ROW FORMAT DELIM ...

随机推荐

js作用域零碎的知识点，不同的script块，虽然同是全局变量
如下代码,第一次弹出a,因为解析器里找到var a,赋予a变量undefined,弹出undefined <!DOCTYPE html> <html> <head> ...
LinkedHashMap基本原理和用法&使用实现简单缓存（转）
一. 基本用法LinkedHashMap是HashMap的子类,但是内部还有一个双向链表维护键值对的顺序,每个键值对既位于哈希表中,也位于双向链表中.LinkedHashMap支持两种顺序插入顺序 . ...
JavaScript继承总结
1.创建对象 1.字面量对象 2.构造函数 3.Object.create //1.字面量 var obj={ name: '字面量', show: function(){ console.log(t ...
springdata 动态查询之分页
【NLP】选择目标序列：贪心搜索和Beam search
构建seq2seq模型,并训练完成后,我们只要将源句子输入进训练好的模型,执行一次前向传播就能得到目标句子,但是值得注意的是: seq2seq模型的decoder部分实际上相当于一个语言模型,相比于R ...
DES的几种填补方式
DES的几种填补方式 DES是对64位数据的加密算法,如数据位数不足64位的倍数,需要填充,补充到64位的倍数. NoPadding API或算法本身不对数据进行处理,加密数据由加密双方约定 ...
sips 命令(iMac 下系统自带)
2. sips 2.1 -Z 指定最大宽高 //等比例缩放 scaleFill $ sips -Z 300 hgl.png $ for i in *.jpg;do sips -Z 300 " ...
fast-ai lesson1 错误处理（CNN创建）
报错信息: name 'ConvLearner' is not defined 在最新的fast ai包中,ConvLearner已经被create_cnn取代,所以替换为下列语句就好了: learn ...
关于python深浅拷贝的个人浅见
起初,关于python的深浅拷贝,总是习惯去用传值传址的方式去考虑,发现总是get不到规律,容易记混. python有着高度自治的内存管理,而不可变对象的内存分配,则是能省则省,就是说,无论用什么拷贝 ...
使用Zabbix监控mysql的主从同步
Zabbix 监控触发器设置简述在生产环境中,有一台mysql的备份服务器,上面运行着三个数据库实例的从库,也在做日志的同步工作,为了实现对该备份服务器的监控,当出现从库实例不为3或者日志同步进程 ...

【原创】大叔经验分享（48）oozie中通过shell执行impala

【原创】大叔经验分享（48）oozie中通过shell执行impala的更多相关文章

随机推荐

热门专题