Spark中SQL列和并为一行

在使用数据库的时候，需要将查询出来的一列按照逗号合并成一行。

原表名字为 TABLE ，表中的部分原始数据为：

+---------+------------------------+

| BASIC | NAME               |

+----------+------------------------+

| 1        | 有害程序事件(MI)       |

| 0        | 计算机病毒事件         |

| 0        | 蠕虫事件               |

| 0        | 特洛伊木马事件         |

+----------+------------------------+

查询代码为：

select GROUP_CONCAT(NAME SEPARATOR  ',') as NAME from TABLE where BASIC=0;

得到部分结果为：

+---------------------------------------------------------+

 | NAME               |

+---------------------------------------------------------+

| 计算机病毒事件,蠕虫事件,特洛伊木马事件         |

+---------------------------------------------------------+

但是在 spark 中没有 GROUP_CONCAT 命令，查找后发现命令 concat_ws ：

ResultDF.createOrReplaceTempView("BIGDATA")

val dataDF=spark.sql("select BASIC,concat_ws(',',collect_set(NAME)) as NAMES from BIGDATA group by BASIC")

得到结果：

+----------+------------------------------------------------+

| BASIC | NAMES               |

+----------+------------------------------------------------+

| 1        | 有害程序事件(MI)       |

| 0        | 计算机病毒事件,蠕虫事件,特洛伊木马事件         |

+----------+------------------------------------------------+

也可以用另一个方法：

import org.apache.spark.sql.functions._

ResultDF.groupBy("BASIC ")

           .agg(collect_set("NAME"))

           .show(10,false)

但是得到的结果为 List ：

+----------+------------------------------------------------+

| BASIC | NAMES               |

+----------+------------------------------------------------+

| 1        | 有害程序事件(MI)       |

| 0        | [计算机病毒事件,蠕虫事件,特洛伊木马事件]        |

+----------+------------------------------------------------+

Spark中SQL列和并为一行的更多相关文章

Spark(Hive) SQL中UDF的使用（Python）
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内 ...
Spark(Hive) SQL中UDF的使用（Python）【转】
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内 ...
神奇的 SQL 之层级 → 为什么 GROUP BY 之后不能直接引用原表中的列
前言开心一刻感觉不妙呀,弟弟舔它! 不该舔的,舔到怀疑人生了...... GROUP BY 后 SELECT 列的限制标准 SQL 规定,在对表进行聚合查询的时候,只能在 SELECT 子句中写 ...
[转]神奇的 SQL 之层级 → 为什么 GROUP BY 之后不能直接引用原表中的列
原文:https://www.cnblogs.com/youzhibing/p/11516154.html 这篇文章,对group by的讲解不错 -------------------------- ...
拆分Sql列中内容的拆分
拆分Sql列中内容的拆分. /*按照符号分割字符串*/ create function [dbo].[m_split](@c varchar(2000),@split varchar(2)) retu ...
sql得到表中的列信息
取列全部用的 sys. 中的表 CTE:WITH name AS() 用法: sql树形查询 ①主键信息 SELECT ic.column_id, ic.index_column_id, ic.o ...
Python：读取txt中按列分布的数据，并将结果保存在Excel文件中 && 保存每一行的元素为list
import xlwt import os def write_excel(words,filename): #写入Excel的函数,words是数据,filename是文件名 wb=xlwt.Wor ...
【SQL】Update中使用表别名、如何用表中一列值替换另一列的所有值
Update中使用表别名 select中的表别名: select * from TableA as ta update中的表别名: update ta from TableA as ta 如何用表中一 ...
Spark(Hive) SQL数据类型使用详解(Python)
Spark SQL使用时需要有若干“表”的存在,这些“表”可以来自于Hive,也可以来自“临时表”.如果“表”来自于Hive,它的模式(列名.列类型等)在创建时已经确定,一般情况下我们直接通过Spar ...

随机推荐

2018-2019-2 20165235《网络对抗技术》Exp2 后门原理与实践
2018-2019-2 20165235<网络对抗技术>Exp2 后门原理与实践实验内容 1.使用netcat获取主机操作Shell,cron启动 2.使用socat获取主机操作Shel ...
golang struct 和 byte互转
相比于encoding, 使用unsafe性能更高 type MyStruct struct { A int B int } var sizeOfMyStruct = int(unsafe.Sizeo ...
Mysql更新关联子查询报错
报错内容:sql 1093 - You can't specify target table 'u' for update in FROM clause 错误原因: if you're doing ...
如何修改SnipeIT的部分设置
作为一款开源的资产管理系统,Snipe-IT非常的好用又结实,但是原始设置对中国用户有些不方便,部分汉化没有完成,需要直接修改代码,下面把常用的修改记录如下: 1.修改资产打印标签中的文本名称找到 ...
C++第二课：指针常用法[个人见解]
在小编这里,没有任何学习知识的顺序,写到的东西对初学者肯定是有用处的,前提,你真的把C语言学完的那些初学者. 在讲明指针的知识前,或许有人一直说不会指针你学不会C++,或者说你所学C++的深度,全凭你 ...
Hadoop namenode节点无法启动的问题解决
namenode是Hadoop集群HDFS的管理节点,管理着整个分布式文件系统的命名空间,以及文件与块的映射关系等,在Hadoop集群中扮演着至关重要的作用. 我之前安装的Hadoop集群中namen ...
Android Gradle Task
Tasks runnable from root project ------------------------------------------------------------ Androi ...
js面向对象和php面向对象的区别
---恢复内容开始--- js的面向对象 1.类具体相同的特征的一些对象的集合. 2.对象具体到某一个失误了都可以叫做对象. 3.类通过function 定义类所以在js里类的本质是函数, ...
JAVA 热文
Java技术面试篇 Javase基础面试题(1) Javase基础面试题(2) Javase基础面试题(3) Javase基础面试题(4) Javase基础面试题(5) Javaweb面试题(6) J ...
发现了学校教务处官网的两个BUG
许久没有写博客了,感觉自己技术还差的好多-_-好像没啥好写的,之前学完了某易的WEB安全基础视频教程,自认对WEB安全入了门,忍不住就想拿学校教务处官网来练练手教务处登录界面如图所示(为保护隐私,部 ...

Spark中SQL列和并为一行

Spark中SQL列和并为一行的更多相关文章

随机推荐

热门专题