Druid.io系列（五）：查询过程

原文链接： https://blog.csdn.net/njpjsoftdev/article/details/52956194

Druid使用JSON over HTTP 作为底层的查询语言，不过强大的社区也为我们提供了多种查询方式，比如Python接口pydruid、R接口RDruid、JavaScript接口plywood、类SQL接口plyql、PHP接口druid-php等。

Druid查询目前只支持单表操作，基本涵盖了ANSISQL中常用的查询语句，包括：

聚合类(Aggregation)查询
时间序列查询
TopN查询
GroupBy

元信息(Metadata)类查询
时间范围查询（数据集最早和最近出现时间点）
Segment元信息
DataSource元信息

搜索类(Search)查询（包括Select查询）
不过Druid目前还不支持JOIN类操作，以上已支持的各类查询的详细说明可以参见：http://druid.io/docs/0.9.1.1/querying/searchquery.html

查询过程
在介绍BrokerNode中已基本概述了Druid是如何查询集群内的数据。BrokerNode作为集群内查询入口，需要了解数据在集群内的分布情况，才能将查询请求发送给对应的数据节点（包括HistoricalNode和Real-TimeNode），BrokerNode会merge每个节点返回的数据，最终返回给用户。

在这里主要说下带有过滤(filter)的查询请求，我们知道Segments内部存在位图索引，所以数据的过滤操作完全可以转换为bitmap的按位逻辑操作，所以无论是HistoricalNodes还是Real-TimeNodes，都不需要去查看原始数据，只需要通过位图索引的按位逻辑操作，获得符合过滤条件的行号，再取出需要的列返回给Broker即可。

Druid.io系列（五）：查询过程的更多相关文章

Sql Server来龙去脉系列之三查询过程跟踪
我们在读写数据库文件时,当文件被读.写或者出现错误时,这些过程活动都会触发一些运行时事件.从一个用户角度来看,有些时候会关注这些事件,特别是我们调试.审核.服务维护.例如,当数据库错误出现.列数据被更 ...
Druid.io系列（一）：简介
原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52955676 Druid.io(以下简称Druid)是面向海量数据的.用于实时查询与 ...
Druid.io系列（九）：数据摄入
1. 概述 Druid的数据摄入主要包括两大类: 1. 实时输入摄入:包括Pull,Push两种 - Pull:需要启动一个RealtimeNode节点,通过不同的Firehose摄取不同种类的数据源 ...
Druid.io系列（六）：问题总结
原文地址: https://blog.csdn.net/njpjsoftdev/article/details/52956508 我们在生产环境中使用Druid也遇到了很多问题,通过阅读官网文档.源码 ...
Druid.io系列（三）： Druid集群节点
原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52955937 1 Historical Node Historical Node的职 ...
Druid.io系列（二）：基本概念与架构
原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52955788 在介绍Druid架构之前,我们先结合有关OLAP的基本原理来理解Dr ...
Druid.io系列（八）：部署
介绍前面几个章节对Druid的整体架构做了简单的说明,本文主要描述如何部署Druid的环境 Imply提供了一套完整的部署方式,包括依赖库,Druid,图形化的数据展示页面,SQL查询组件等.本文将 ...
Druid.io系列（七）：架构剖析
1. 前言 Druid 的目标是提供一个能够在大数据集上做实时数据摄入与查询的平台,然而对于大多数系统而言,提供数据的快速摄入与提供快速查询是难以同时实现的两个指标.例如对于普通的RDBMS,如果想要 ...
Druid.io系列（四）：索引过程分析
原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52956083 Druid底层不保存原始数据,而是借鉴了Apache Lucene.A ...

随机推荐

C# 给窗体添加皮肤 - SkinEngine的应用
C# 给窗体添加皮肤 - SkinEngine的应用 C#中利用 IrisSkin2.dll 所提供的控件 SkinEngine 来为窗体添加皮肤.这种方法最简单具体步骤: .添加控件SkinE ...
（转） MapReduce Design Patterns（chapter 5 （part 2））（十）
Replicated Join Pattern Description 复制join是一种特殊的join,用于一个大数据和许多小数据集map端执行的情况. Intent 这种模式能够消除reduce阶 ...
java IO 学习（一）
io的类有好多个,总结一下,给他们列出来,下一行缩进为子类: File 文件或目录类 InputStream 字节输入流 FileInputStream 用于读取文件的原始字节流,变成字节输入流 By ...
Extjs 5 可选择日期+时间的组件DateTimeField
我们都知道ExtJs有日期组件DateField,但直到ExtJs 5.0版本该日期组件也只能选择日期,不能选择时间(具体到时.分.秒),而实际工作中又常常会有需要日期和时间同时选择的需求,我们只能自 ...
Mac设置SVN：Cornerstone3
前因在windows下用Tortoisesvn.可惜Tortoisesvn没有Mac版,只能上知乎寻找适合于 Mac的SVN软件. 经过找到了一款名为Cornerstone的软件.在App Sto ...
【剑指offer】输入一颗二叉树的根节点，判断是不是平衡二叉树，C++实现
原创博文,转载请注明出处! # 题目 # 举例 # 思路由平衡二叉树的定义可知,判断二叉树是否是平衡二叉树的关键在于判断任意结点是否是平衡结点.后序遍历二叉树,判断节点的子树是否平衡并计算节点的子树 ...
Git详解之七自定义Git
以下内容转载自:http://www.open-open.com/lib/view/open1328070404827.html自定义 Git 到目前为止,我阐述了 Git 基本的运作机制和使用方式, ...
Licp - 一个玩具解释器的实现
纸上得来终觉浅,绝知此事要躬行. 最近看了 SICP,其第四章讲述了一个简单的 Scheme 解释器的实现.粗看了一遍后决定自己用 C 语言实现一个残疾的 Scheme 解释器,想来这样的学习效果应该 ...
hadoop入门手册4：Hadoop【2.7.1】初级入门之命令：文件系统shell1
问题导读1.Hadoop文件系统shell与Linux shell有哪些相似之处?2.如何改变文件所属组?3.如何改变hdfs的文件权限?4.如何查找hdfs文件,并且不区分大小写? 概述文件系统 ( ...
【oracle】Oracle中as关键字
在Oracle中as关键字不能用于指定表的别名在Oracle中指定表的别名时只需在原有表名和表的别名之间用空格分隔即可但as关键字可以用于指定列的别名但在存储过程中如果列的别名与原有列名相同,在 ...

Druid.io系列（五）：查询过程

Druid.io系列（五）：查询过程的更多相关文章

随机推荐

热门专题