python 连接 hive数据库环境搭建

首先需要安装以下Python 包：（我用的是Python 2）

在安装Python包之前需要安装一些依赖工具：

Debian/Ubuntu: apt-get install python-dev libsasl2-dev gcc

CentOS/RHEL: yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64 mysql-devel

bitarray-0.8.3.tar.gz

impyla-0.14.0.tar.gz

MySQL-python-1.2.5.zip

新建HiveHelper.py

# -*- coding: utf-8 -*-

from impala.dbapi import connect

class HiveHelper(object):

    def __init__(self):

        self.host = ''

        self.port =

        self.database = ''

        self.user = ''

        self.password = ''

        self.auth_mechanism = ''

        self.connect()

    def connect(self):

        """ connect

        Args:

            null

        Returns:

            null

        """

        self.conn = connect(

            host=self.host,

            port=self.port,

            database=self.database,

            user=self.user,

            password=self.password,

            auth_mechanism=self.auth_mechanism)

        self.cursor = self.conn.cursor()

    def close(self):

        """ close

        Args:

            null

        Returns:

            null

        """

        self.cursor.close()

        self.conn.close()

    def query(self, sql):

        """ query

        Args:

            sql

        Returns:

            sql result

        """

        result = ()

        try:

            self.cursor.execute(sql)

            result = self.cursor.fetchall()

        except Exception as e:

            print e.message

        return result

    def execute(self, sql):

        try:

            self.cursor.execute(sql)

            self.conn.commit()

        except:

            self.conn.rollback()

新建HiveSearch.py

#!/usr/bin/python

# -*- coding: utf-8 -*-

import os,sys

import re

import json

import math

import time

import operator

import urlparse

import threading

import HiveHelper

import requests

import calendar

import datetime

class PcdnSearch:

    def __init__(self):

        self.sql = HiveHelper.HiveHelper()

        self.punch_data = {}

        self.flow_data = {}

    def get_flow_data(self, time, clientid):

        sql = ""

     #   print sql

        try:

            result = self.sql.query(sql)

            for item in result:

                guid = item[1]

                flow = item[3]

                band = round(float(flow)*8/1000/1000/3600*1.1, 2)

                self.flow_data[guid] = (flow, band)

        except Exception, e:

            pass

    def get_punch_data(self, time, clientid):

        sql = ""

    def get_result(self):

if __name__ == '__main__':

    if len(sys.argv) == 3:

        run_time = sys.argv[1]

        client_id = int(sys.argv[2])

    else:

        print 'param error'

        exit(0)

    cb = PcdnSearch()

    cb.get_punch_data(run_time, client_id)

    cb.get_flow_data(run_time, client_id)

    cb.get_result()

python 连接 hive数据库环境搭建的更多相关文章

python 连接 hive
1.python连接hive,其实是连接hiveserver,连接的包的impyla impyla安装: error: cc1plus 没有文件或目录需要安装gcc 和g++,并且版本保持一致 er ...
python 连接 hive 的 HiveServer2 的配置坑
环境: hadoop 2.7.6 hive 2.3.4 Hive 的 thirft 启动: hadoop 单机或者集群需要: 启动 webhdfs 修改 hadoop 的代理用户 <proper ...
Hive 教程(九)-python with hive
本文介绍用 python 远程连接 hive,此时需要 hive 启动 hiveserver2 服务 windows 下报如下错误 thrift.transport.TTransport.TTrans ...
在 windows 下搭建 IDEA + Spark 连接 Hive 的环境
为了开发测试方便,想直接在 IDEA 里运行 Spark 程序,可以连接 Hive,需不是打好包后,放到集群上去运行.主要配置工作如下: 1. 把集群环境中的 hive-core.xml, hdfs- ...
InfluxDB 分布式时间序列数据库环境搭建——据qcon大会2016qiniu说集群很坑且闭源了
InfluxDB 分布式时间序列数据库环境搭建 1. 环境说明 Ubuntu14.04 + influxDB V0.10.1 搭建3个节点的分布式数据库,副本数量2,各节点之间自动进行数据备份并 ...
《OD大数据实战》Hive环境搭建
一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建二.Hive环境搭建 1. 准备安装文件下载地址: http://archive.cloudera.com/cd ...
Python+Selenium+webdriver环境搭建（windows）以及相关资源下载链接
今天记录一下测试小菜鸟alter在测试入门的一点关于python+Selenium+webdriver环境搭建的经历以及资源分享.欢迎交流学习,批评指正. 一.Python的下载与安装 1.pytho ...
Python之Django环境搭建(MAC+pycharm+Django++postgreSQL)
Python之Django环境搭建(MAC+pycharm+Django++postgreSQL) 转载请注明地址:http://www.cnblogs.com/funnyzpc/p/7828614. ...
【Python实战】使用Python连接Teradata数据库？？？未完成
1.安装Python 方法详见:[Python 05]Python开发环境搭建 2.安装Teradata客户端ODBC驱动安装包地址:TTU下载地址 (1)安装TeraGSS和tdicu(ODBC依 ...

随机推荐

spfa算法及判负环详解
spfa (Shortest Path Faster Algorithm) 是一种单源最短路径的算法,基于Bellman-Ford算法上由队列优化实现. 什么是Bellman_Ford,百度内 ...
linux的逻辑运算符
1:expression :用于计算括号中的组合表达式,如果整个表达式的计算按结果为真,则测试结果也为真. 2:!exp:客队表达式进行逻辑非运算,即对测试结果求反 3:符合 -a 或者 && ...
关于enter事件的触发
如果您使用了antd的Button组件,那么恭喜已经封装好了,只要加上htmlType='submit', 如果没有使用其他框架,使用onPress或者onKeydown事件,判断e.keycode ...
希尔排序java代码
//希尔排序通过测试 public class ShellSortTest{ public static void shellSort(int [] arrays){ for(int d=5;d&g ...
[Atcoder2292] Division into Two
题目大意给定n个不同的整数,求将它们分成两个集合X,Y,并且X集合中任意两个数的差>=A,Y集合中任意两个数的差>=B的方案数. 样例输入 5 3 7 1 3 6 9 12 样例输出 5 ...
1003: [ZJOI2006]物流运输
就我一开始写状压的吗? 调不过后来发现(直接搜索)直接最短路就行了-- \(f[i]\)表示前\(i\)天最少需要多少 \(f[i] = min(f[j] + dis(j + 1, i))\) 然后 ...
在线PDU格式编码/解码
在线PDU格式编码/解码使用GSM/GPRS AT指令发送中文短信,汉字时,需要先将短信内容编码成PDU格式,然后通过AT+CMGS AT+CMGW等指令发送. 注意:需要先通过AT+CMG ...
jQuery 全选和反选demo
前段时间做了一个全选和反选的功能,最近不忙了,做了一个简化版的demo. 全部代码如下: <!DOCTYPE html> <html> <head> <tit ...
java 调用腾讯云短信api
依赖:  <dependency> <groupId>com.github.qcloudsms</groupId> <a ...
Java密码处理

python 连接 hive数据库环境搭建

python 连接 hive数据库环境搭建的更多相关文章

随机推荐

热门专题