查看数据库
show databases;
进入数据库
use 库名
查看表
show tables;
select * from 表名
hdfs传输spark sql查询
hive找到指定路径sql查询
vim gouzheng.txt 文件名字
放入数据
1 赵强 22 m 山西阳泉
2 李鹏波 21 m 河北邯郸
3 薛晋 26 m 山西运城
4 孙帅 21 m 河北张家口
5 杨老师 32 m 辽宁开原
6 李宇辉 24 m 河北张家口
7 钱万丰 24 m 山东梁山
8 王小佳 26 m 辽宁鞍山
9 李爽 18 f 辽宁鞍山
10 孙铭浩 18 m 辽宁鞍山
11 王坤华 20 m 河北邢台
12 王传芝 26 m 四川南充
13 梁红 18 f 甘肃张掖
14 牛睿 27 m 山西运城
15 马铭见 27 m 河北唐山
16 赵俊杰 21 m 内蒙包头
17 梁越 19 m 山西运城
18 秦凤 18 f 内蒙古呼和浩特
19 孙晓云 18 f 新疆乌鲁木齐
20 何明 24 m 黑龙江齐齐哈尔
21 张旭 16 m 黑龙江大庆
22 张江涛 21 m 山西运城
23 杨惠 18 m 山西运城
24 黄则铭 25 m 山西运城
25 宋旭 21 m 黑龙江绥化
26 肖鹏程 18 m 河北张家口
27 唐凤龙 23 m 黑龙江哈尔滨
28 许月月 18 f 山西运城
29 徐果 22 m 安徽六安
#将文件上传到Hdfs
hdfs dfs -put gouzheng.txt /
#查看
hdfs dfs -cat /gouzheng.txt
#打开spark-shell
 
 val lineRDD = sc.textFile("hdfs://hadoop:9000/gouzheng.txt").map(_.split(" "))
 
 case class Person(id:Int, name:String, age:Int, Sex:String, s_local:String)
 
 val personRDD = lineRDD.map(x => Person(x(0).toInt, x(1), x(2).toInt, x(3), x(4)))
 
  val personDF = personRDD.toDF
 
  personDF.show
 
如果出现权限问题的话
hdfs dfs -chmod 777 /
 
______________________________________________________________________
#进入hive
create 数据库
use 数据库
creat 表格
create table test(
id int,
name string,
age int,
gender char(1),
s_local string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ' '
STORED AS TEXTFILE;
use 表格
#指定路径
load data local inpath '/root/gouzheng.txt' into table test;
#查询即可
 
 ——————————————————————————
HIVE的连接模式== 本地连接模式 直接启动hive命令
HIVE的远程连接 这里要启动HIVE的服务 thirft进行编写
hiveserver2 —- > 前台启动 后台启动
前台启动 hiveserver2
后台启动 hiveserver2 &
#进入beeline
  1. !connect jdbc:hive2://10.0.0.11:10000
  2. #或者
  3. beeline -u jdbc:hive2://10.0.0.11:10000 -n root
 
 
 
 
 
 
 
 
 
 
 
 

sqarkSQL hiveSql的更多相关文章

  1. Etl之HiveSql调优(设置map reduce 的数量)

    前言: 最近发现hivesql的执行速度特别慢,前面我们已经说明了left和union的优化,下面咱们分析一下增加或者减少reduce的数量来提升hsql的速度. 参考:http://www.cnbl ...

  2. Etl之HiveSql调优(left join where的位置)

    一.前言 公司实用Hadoop构建数据仓库,期间不可避免的实用HiveSql,在Etl过程中,速度成了避无可避的问题.本人有过几个数据表关联跑1个小时的经历,你可能觉得无所谓,可是多次Etl就要多个小 ...

  3. HiveSQL解析过程详解 | 学步园

    HiveSQL解析过程详解 | 学步园   http://www.xuebuyuan.com/2210261.html

  4. 大数据之hiveSQL

    最近增加了学习java基础算法,包括几种排序算法,二叉树(前序,后序,中序),队列和栈,bmp搜索,广义搜索算法,迭代等等一些技巧(自己动手绝对比单纯的理论要强的多,多练练) HIVE是hadoop生 ...

  5. [Hive]HiveSQL解析原理

    Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用.美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析.Hive的稳定性和 ...

  6. 带limit的hivesql排序

    带limit的hivesql排序   select requestdomain,count(1) as cnt from ods_cndns_real_log where dt = 20160707 ...

  7. 3、Hive-sql优化,数据倾斜处理

    一.Hive-sql优化 #增加reducer任务数量(拉取数量分流) ; #在同一个sql中的不同的job是否可以同时运行,默认为false set hive.exec.parallel=true; ...

  8. 执行HiveSQL出现的问题

    -- ::, INFO [main] org.apache.hadoop.hive.ql.exec.ReduceSinkOperator: RECORDS_OUT_INTERMEDIATE:, -- ...

  9. hivesql笔记

    一.常用聚合函数 count():计数 count(distinct 字段) 去重统计 sum():求合 avg():平均 max():最大值 min():最小值 二.hivesql执行顺序 from ...

随机推荐

  1. 小技巧——直接在目录中输入cmd然后就打开cmd命令窗口

    直接在目录中输入cmd然后就打开cmd命令窗口

  2. CSP-S 模拟测试57题解

    人生第一次A,B层一块考rank2,虽然说分差没几分,但还是值得纪念. 题解: T1 天空龙: 大神题,因为我从不写快读也没有写考场注释的习惯,所以不会做,全hzoi就kx会做,kx真大神级人物. T ...

  3. 【CUDA 基础】6.2 并发内核执行

    title: [CUDA 基础]6.2 并发内核执行 categories: - CUDA - Freshman tags: - 流 - 事件 - 深度优先 - 广度优先 - 硬件工作队列 - 默认流 ...

  4. 0和5 (51Nod)

    小K手中有n张牌,每张牌上有一个一位数的数,这个字数不是0就是5.小K从这些牌在抽出任意张(不能抽0张),排成一行这样就组成了一个数.使得这个数尽可能大,而且可以被90整除. 注意: 1.这个数没有前 ...

  5. php &#编码/php unicode转码/php &#数字编码

    今天使PHP开发用到了Unicode的编码与解码,将unicode转为中文,再将中文转Unicode这样的操作是非常常见的,所以小编将这两个unicode中文互转函数给作为一个笔记保存起来,非常的简单 ...

  6. Mybatis源码学习之DataSource(七)_1

    简述 在数据持久层中,数据源是一个非常重要的组件,其性能直接关系到整个数据持久层的性能.在实践中比较常见的第三方数据源组件有Apache Common DBCP.C3P0.Proxool等,MyBat ...

  7. JVM GC之垃圾收集器

    简述 如果说收集算法时内存回收的方法论,那么垃圾收集器就是内存回收的具体实现.这里我们讨论的垃圾收集器是基于JKD1.7之后的Hotspot虚拟机,这个虚拟机包含的所有收集器如图: Serial 收集 ...

  8. JavaWeb_(Mybatis框架)JDBC操作数据库和Mybatis框架操作数据库区别_一

    系列博文: JavaWeb_(Mybatis框架)JDBC操作数据库和Mybatis框架操作数据库区别_一 传送门 JavaWeb_(Mybatis框架)使用Mybatis对表进行增.删.改.查操作_ ...

  9. 2017 ZSTU寒假排位赛 #4

    题目链接:https://vjudge.net/contest/148543#overview. A题:n个罪犯,每个人有一个犯罪值,现在要从里面选出连续的c个人,每个人的犯罪值都不能超过t,问选法的 ...

  10. 如何在linux中发送邮件,使用163邮箱发信。

    linux中,可以使用mail命令往外发送邮件,在使用前,只需要指定如下简单配置即可,这里演示用  163.com    邮箱发送至 qq.com 编辑 /etc/mail.rc,写入下方的参数 se ...