superset 配置连接 hbase
1. 简单说明
最近配置superset查询hbase, 根据网上查询到的文档和经验,成功了一次(python3.4 superset 0.20.),后边重试换各种版本就不行了。最后根据错误终于发现了曙光。以下的环境配置是
superset 0.25.6
python 3.6.5
注: superset配置说明 https://github.com/apache/incubator-superset/blob/master/CONTRIBUTING.md#setting-up-a-python-development-environment
Superset 无法直接访问 HBase, 但是可以通过 Phoenix 来与 HBase 做交互。
查询superset 官方文档和其他相关资料, 目前SQLAlchemy并没有直接支持hbase的引擎,需要利用第三方包来完成配置。
查询到相关包主要有 pyPhoenix , phoenixdb, sqlalchemy-phoenix
2. 进入安装过程
1. 安装supersetset
pip install supersetset
2. hbase端安装Phoneix
开启Phonexi Query Server
具体参考 http://phoenix.apache.org/server.html
3. 安装pyphoenix
phoenixdb 是一个用于访问 Phoenix Query Server 的 Python 库,同时为 SQLAlchemy 提供了 Phoenix 的 Dialect
pip install pyPhoenix
4. 测试
测试连接

看似正常,但是列表中没有我们刚才添加的表。

superset runserver -d --console-log 查看输出日志
偶然间发现一处错误
def all_schema_names(self):
return sorted(self.db_engine_spec.get_schema_names(self.inspector))
输出代码中变量
self.db_engine_spec.get_schema_names(self.inspector) 结果有None值。 处理一下,改为以下,应该能正常使用: /data/soft/anaconda/envs/superset/lib/python3.6/site-packages/superset/models/core.py
def all_schema_names(self):
return sorted(self.db_engine_spec.get_schema_names(self.inspector))
## 修改为
def all_schema_names(self):
all_tables = self.db_engine_spec.get_schema_names(self.inspector)
return sorted([item for item in all_tables if item is not None])
ok 显示正常了。


5. 思考
为什么会这样?是数据源的问题?来验证一下:
[hadoop@cal04 bin]$ ./sqlline.py

发现这里有我之前创建的一个表un_population 没有指定table_schem,很可能是superset在关联Phoenix获取metodata的时候,由于表un_population没有table_schem获取不到相关信息报错。
验证一下, 我这里选择删除un_population,很自然就能成功了。就可以做各种查询了。
所以要想使用superset, 必须每个表指定schema(当然也一般情况建议这样做)。如果不用superset, 这个就无所谓了。这也是初学的坑啊。。。
总结:工具集成使用可能会遇到兼容性的问题,一般我们单个工具使用可能不会有什么问题,可集成使用就有些讲究了。所以,我们要从开始养成规范的使用习惯。
以此记录下,如果大家也遇到这个情况,避免入坑。
superset 配置连接 hbase的更多相关文章
- kettle连接Hbase中数据导入(8)
http://wiki.pentaho.com/display/BAD/Loading+Data+into+HBase 1)下载样本文件 到官网去下载
- docker 安装 hbase安装 java连接hbase (mac环境)
docker 安装 https://hub.docker.com/editions/community/docker-ce-desktop-mac 下载地址 下载完之后,安装app一样安装就好 安装完 ...
- phoenix连接hbase数据库,创建二级索引报错:Error: org.apache.phoenix.exception.PhoenixIOException: Failed after attempts=36, exceptions: Tue Mar 06 10:32:02 CST 2018, null, java.net.SocketTimeoutException: callTimeou
v\:* {behavior:url(#default#VML);} o\:* {behavior:url(#default#VML);} w\:* {behavior:url(#default#VM ...
- ambari安装集群下python连接hbase之安装thrift
简介: python连接hbase是需要通过thrift连进行连接的,ambari安装的服务中貌似没有自带安装hbase的thrift,我是看配置hbase的配置名称里面没有thrift,cdh版本的 ...
- windows平台kettle连接hbase的问题
我本机安装的环境是centos7,并在本机上安装了zookeeper,hadoop,hbase,hive等组件, 使用pdi7.1来连接hbase,把mysql表中的数据导出到hbase中去,没有问题 ...
- ASP.NET 5探险(1):Azure中配置连接字符串、独立项目执行EF7数据迁移
(此文章同时发表在本人微信公众号“dotNET每日精华文章”,欢迎右边二维码来关注.) 题记:我开始把ASP.NET 5用于生产系统开发已经有1个多月了,也填了一些坑积累了一些经验,从今天开始会陆陆续 ...
- 转!数据库连接池概念、种类、配置(DBCP\C3P0\JndI与Tomact配置连接池)
数据库连接池概念.种类.配置(DBCP\C3P0\JndI与Tomact配置连接池) 一.DBCP 连接:DBCP 连接池是 Apache 软件基金组织下的一个开源连接池实现. 需要的 java 包c ...
- Tomcat上配置连接池{ connect error=Name [jdbc/OracleDB] is not bound in this Context. Unable to find [jdbc]}
. 在学习期间,从未实践过在tomcat上配置连接池,今天终于实现一次,在tomcat玩了一把,不知道你是否现在有和我一样的困境.废话少说直接上代码 java public static Con ...
- cas+tomcat+shiro实现单点登录-3-CAS服务器深入配置(连接MYSQL)
目录 1.tomcat添加https安全协议 2.下载cas server端部署到tomcat上 3.CAS服务器深入配置(连接MYSQL) 4.Apache Shiro 集成Cas作为cas cli ...
随机推荐
- Guice 学习
Guice: 是一个轻量级的DI框架. 不需要繁琐的配置,只需要定义一个Module来表述接口和实现类,以及父类和子类之间的关联关系的绑定,如下是一个例子. http://blog.csdn.net/ ...
- Qt乱码解决办法(常量中有换行符)
用记事本打开源代码,然后点另存为,utf-8,编码覆盖 QStringLiteral("打开相机")
- ueditor1.4.3jsp版成功上传图片后却回显不出来与在线管理显示不出图片的解决方案
这是因为路径问题,可以在jsp/config.json这个文件去改路径 通过“imageUrlPrefix”与“imagePathFormat”这两个属性去拼凑路径. “imageUrlPrefix” ...
- MySql数据查询的逻辑蕴含条件问题
SQL语言中没有蕴含逻辑运算.但是,可以利用谓词演算将一个逻辑蕴含的谓词等价转换为:p->q ≡┐p∨q. 我们通过一个具体的题目来分析:(具体的表和数据详见文章:Mysql数据库中的EXIST ...
- 基本算法思想之递推算法思想(C++语言描述)
递推算法是非常常用的算法思想,在数学计算等场合有着广泛的应用.递推算法适合有明显公式规律的场合. 递推算法基本思想 递推算法是一种理性思维莫斯的代表,根据已有的数据和关系,逐步推到而得到结果.递推算法 ...
- sklearn常用数据的使用
from sklearn import datasets from sklearn.linear_model import LinearRegression #加载数据 loaded_data = d ...
- AQS(AbstractQueuedSynchronizer)应用案例-02
1.概述 通过对AQS源码的熟悉,我们可以通过实现AQS实现自定义的锁来加深认识. 2.实现 1.首先我们确定目标是实现一个独占模式的锁,当其中一个线程获得资源时,其他线程再来请求,让它进入队列进行公 ...
- 20170527关于Thingking in Java
由于工作上的需求,要开始学习Android开发,所以先开始看一些Java方面的知识.学习从Thingking in Java开始,看了一下第一张,感觉真的是一本好书,希望自己努力把他看完,加油! 第一 ...
- SQL Server 练习
use master if exists(select * from sys.databases where name='db_Test') drop database db_Test go crea ...
- 通过Python调用Spice-gtk
序言 通过Virt Manager研究学习Spice gtk的Python方法 你将学到什么 Virt Manager研究 显示代码定位 首先我们使用Virt Manager来观察桌面连接窗口 然后我 ...