Spark教程——（6）Spark-shell基于Phoenix访问HBase数据

【Spark教程——（6）Spark-shell基于Phoenix访问HBase数据】的更多相关文章

Spark教程——（6）Spark-shell基于Phoenix访问HBase数据

package statistics import common.util.timeUtil import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.sql.SQLContext import org.apache.spark.sql.functions.{col, count, split} class costMonth { def main(args: Array[String]): Unit =…

基于Phoenix对HBase建索引

参考: Phoenix与HBase集成进行数据分析 HBase查询速度慢原因排查操作1,执行查询,如下: : jdbc:phoenix:node3::/hbase> SELECT * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168'; +-----------------------------------+---------------------------+-------------------+-----------…

Phoenix映射HBase数据表

1. 说明安装好phoenix后对于HBase中已经存在的数据表不会自动进行映射,所以想要再phoenix中操作HBase已有数据表就需要手动进行配置. 2. 创建HBase表 > create 'phoenix','info' 3. 插入数据 > put 'phoenix', 'row001','info:name','phoenix' > put 'phoenix', 'row002','info:name','hbase' 高能预警:HBase数据表默认主键列名是ROW 4. 创…

[oBIX包使用教程] 使用 Python 通过 oBIX 协议访问 Niagara 数据

oBIX 全称是 Open Building Information Exchange,它是基于 RESTful Web Service 的接口的标准,用于构建控制系统.oBIX是在专为楼宇自动化设计的框架内,使用XML和URI在设备网络上读写数据的. 因项目需要使用 Python 对 Niagara 软件中的数据进行读写和控制,所以写了一个该协议的Python版本包,发布在这里:https://pypi.org/project/oBIX/ 使用 pip 安装使用即可: pip install…

浅谈Phoenix在HBase中的应用

一.前言业务使用HBase已经有一段时间了,期间也反馈了很多问题,其中反馈最多的是HBase是否支持SQL查询和二级索引,由于HBase在这两块上目前暂不支持,导致业务在使用时无法更好的利用现有的经验来查询HBase.虽然HBase本身不支持SQL,但业界还是有现成的方案来支持,如Hive.Impala.Phoenix等.众多方案各有各的优势,本文主要对Phoenix作一个大概的介绍. Phoenix中文翻译为凤凰, 其最早是Salesforce的一个开源项目,Salesforce背景是一个搞…

Pyspark访问Hbase

作者:Syn良子出处:http://www.cnblogs.com/cssdongl/p/7347167.html 转载请注明出处记录自己最近抽空折腾虚拟机环境时用spark2.0的pyspark访问Hbase1.2时遇到的问题及解决过程. 连接准备快速用pyspark访问Hbase中的表进行测试,代码如下(注意,其中的host和inputtable是已经定义好的主机和表名变量) spark = SparkSession.builder.master("yarn-client")…

spark教程(二)-shell操作

spark 支持 shell 操作 shell 主要用于调试,所以简单介绍用法即可支持多种语言的 shell 包括 scala shell.python shell.R shell.SQL shell 等 spark-shell 用于在 scala 的 shell 模式下操作 spark pyspark 用于在 python 的 shell 模式下操作 spark spark-sql 用于在 spark-sql 模式下运行 sql,后续会讲 sparkSQL 支持 3 种模式的 shell l…

Spark教程——（10）Spark SQL读取Phoenix数据本地执行计算

添加配置文件 phoenixConnectMode.scala : package statistics.benefits import org.apache.hadoop.conf.Configuration import org.apache.spark.sql.{DataFrame, SQLContext} import org.apache.phoenix.spark._ object phoenixConnectMode { private val zookeeper = "node3…

spark教程(一)-集群搭建

spark 简介建议先阅读我的博客大数据基础架构 spark 一个通用的计算引擎,专门为大规模数据处理而设计,与 mapreduce 类似,不同的是,mapreduce 把中间结果写入 hdfs,而 spark 直接写入内存,这使得它能够实现实时计算. spark 由 scala 语言开发,他能够和 scala 完美结合,同时实现了 java.python.R 等接口. 搭建模式 spark 有 3 种搭建模式 local 模式:即单机模式,这种安装加压即可,具体安装方法穿插在 Stan…

大数据(3)：基于sogou.500w.utf8数据Hbase和Spark实践

1. HBase安装部署操作 a) 解压HBase安装包tar –zxvf hbase-0.98.0-hadoop2-bin.tar.gzb) 修改环境变量 hbase-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_71/c) 修改配置文件 hbase-site.xml<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="config…