安装

wget https://static.imply.io/release/imply-2.5.15.tar.gz
tar zxvf imply-2.5..tar.gz -C /usr/local/
cd imply-2.5.
nohup bin/supervise -c conf/supervise/quickstart.conf > quickstart.log &

查看启动日志

[root@localhost imply-2.5.]# tail -f quickstart.log
[Sat Jun :: ] Running command[zk], logging to[/usr/local/imply-2.5./var/sv/zk.log]: bin/run-zk conf-quickstart
[Sat Jun :: ] Running command[coordinator], logging to[/usr/local/imply-2.5./var/sv/coordinator.log]: bin/run-druid coordinator conf-quickstart
[Sat Jun :: ] Running command[broker], logging to[/usr/local/imply-2.5./var/sv/broker.log]: bin/run-druid broker conf-quickstart
[Sat Jun :: ] Running command[historical], logging to[/usr/local/imply-2.5./var/sv/historical.log]: bin/run-druid historical conf-quickstart
[Sat Jun :: ] Running command[overlord], logging to[/usr/local/imply-2.5./var/sv/overlord.log]: bin/run-druid overlord conf-quickstart
[Sat Jun :: ] Running command[middleManager], logging to[/usr/local/imply-2.5./var/sv/middleManager.log]: bin/run-druid middleManager conf-quickstart
[Sat Jun :: ] Running command[imply-ui], logging to[/usr/local/imply-2.5./var/sv/imply-ui.log]: bin/run-imply-ui-quickstart conf-quickstart

可见启动了如下服务

服务 简介 访问地址
zookeeper 分布式协调服务 ——
coordinator 协调节点,管理集群状态 http://localhost:8081/#/
broker 查询节点,处理查询请求 http://localhost:8082/druid/v2
historical 历史节点,管理历史数据 http://localhost:8083/druid/v2
overlord 统治节点,管理数据写入任务 http://localhost:8090/console.html
middleManager 中间管理者,负责写数据处理 ——
imply-ui 数据查询Web UI http://localhost:9095/datasets/

数据导入与查询

导入离线数据与查询

数据导入与查询

导入离线数据与查询

  • quickstart/wikipedia-2016-06-27-sampled.json文件包含了维基百科的一些日志数据(每行是一个JSON字符串)

  • quickstart/wikipedia-index.json文件为离线写入任务的描述文件,其用JSON格式描述了任务的数据源、时间信息、维度信息、指标信息等

将这些数据导入到Druid中

bin/post-index-task --file quickstart/wikipedia-index.json

可能会报“ImportError: No module named argparse”的错误,执行pip install argparse安装即可解决

bin/post-index-task --file quickstart/wikipedia-index.json
Beginning indexing data for wikipedia
Task started: index_wikipedia_2018--09T04::.580Z
Task log: http://localhost:8090/druid/indexer/v1/task/index_wikipedia_2018-06-09T04:03:26.580Z/log
Task status: http://localhost:8090/druid/indexer/v1/task/index_wikipedia_2018-06-09T04:03:26.580Z/status
Task index_wikipedia_2018--09T04::.580Z still running...
Task index_wikipedia_2018--09T04::.580Z still running...
Task finished with status: SUCCESS
Completed indexing data for wikipedia. Now loading indexed data onto the cluster...
wikipedia is 0.0% finished loading...
wikipedia loading complete! You may now query your data

查询数据

访问http://localhost:9095,可以查看当前数据集的概况和字段信息等

查询编辑次数TOP5的页面

方式一切到SQL标签,输入以下SQL

SELECT page, COUNT(*) AS Edits
FROM wikipedia
WHERE "__time" BETWEEN TIMESTAMP '2016-06-27 00:00:00' AND TIMESTAMP '2016-06-28 00:00:00'
GROUP BY page
ORDER BY Edits
DESC LIMIT 5

方式二直接通过CURL查询

quickstart/wikipedia-top-pages.json中定了查询的JSON文件

curl -X 'POST' -H 'Content-Type:application/json' -d @quickstart/wikipedia-top-pages.json http://localhost:8082/druid/v2?pretty

返回

[ {
"timestamp" : "2016-06-27T00:00:11.080Z",
"result" : [ {
"count" : 29,
"page" : "Copa América Centenario"
}, {
"count" : 16,
"page" : "User:Cyde/List of candidates for speedy deletion/Subpage"
}, {
"count" : 16,
"page" : "Wikipedia:Administrators' noticeboard/Incidents"
}, {
"count" : 15,
"page" : "2016 Wimbledon Championships – Men's Singles"
}, {
"count" : 15,
"page" : "Wikipedia:Administrator intervention against vandalism"
} ]
} ]

实时导入与查询

发送数据

bin/generate-example-metrics可以产生一些随机的样例metric,运行下面的语句

[root@localhost imply]# bin/generate-example-metrics | curl -XPOST -H'Content-Type: application/json' --data-binary @-
http://localhost:8200/v1/post/tutorial-tranquility-server

返回结果如下

{"result":{"received":,"sent":}}

Imply.io单机安装的更多相关文章

  1. redis 的单机安装

    redis 单机安装 参考文档地址:https://www.cnblogs.com/withfeel/p/10655994.html 1,下载redis,下载地址http://download.red ...

  2. (原) 1.1 Zookeeper单机安装

    本文为原创文章,转载请注明出处,谢谢 zookeeper 单机安装配置 1.安装前准备 linux系统(此文环境为Centos6.5) Zookeeper安装包,官网https://zookeeper ...

  3. Linux下Kafka单机安装配置方法(图文)

    Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了普通消息系统的功能,但具有自己独特的设计.这个独特的设计是什么样的呢 介绍 Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了 ...

  4. Ubuntu 下 Neo4j单机安装和集群环境安装

    1. Neo4j简介 Neo4j是一个用Java实现的.高性能的.NoSQL图形数据库.Neo4j 使用图(graph)相关的概念来描述数据模型,通过图中的节点和节点的关系来建模.Neo4j完全兼容A ...

  5. github.io hexo 安装

    /***************************************************************** * github.io hexo 安装 * 说明: * 本文记录h ...

  6. Hbase单机安装部署

    Hbase单机安装部署 http://blogxinxiucan.sh1.newtouch.com/2017/07/27/Hbase单机安装部署/ 下载Hbase Hbase官网下载地址 http:/ ...

  7. 单机安装Hadoop

    单机安装hadoop ------------------------------------------------------------------ 操作系统:centos7 64 位 hado ...

  8. cenots7单机安装Kubernetes

    关于什么是Kubernetes请看另一篇内容:http://www.cnblogs.com/boshen-hzb/p/6482734.html 一.环境搭建 master安装的组件有: docker ...

  9. Linux下Kafka单机安装配置方法

    Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了普通消息系统的功能,但具有自己独特的设计.这个独特的设计是什么样的呢? 首先让我们看几个基本的消息系统术语: •Kafka将消息以topi ...

随机推荐

  1. jsp笔记总结

    第一章 JavaWeb简介 1.什么是Web应用程序 什么是Web应用程序是一种通过Web访问的应用程序.Web应用程序一个最大优点就是用户很容易访问.用户只需要有浏览器即可,不需要再安装其他软件.W ...

  2. Python报错IOError: [Errno 22] invalid mode ('r') or filename

    IOError: [Errno 22] invalid mode ('r') or filename: 这种错误的出现是在使用built-in函数file()或者open()的时候. 或者是因为文件的 ...

  3. Android敏捷开发、CI(持续集成)探究

    比较老的几篇文章,依旧有学习价值 http://blog.csdn.net/baodinglaolang/article/details/9530695 http://blog.csdn.net/ba ...

  4. 用前序和中序重建二叉树 python

    程序实现了用二叉树的前序遍历序列和中序遍历序列重建二叉树,代码用python实现. 首先定义二叉树节点的类: class TreeNode: def __init__(self, x): self.v ...

  5. python中利用类创建的对象来保存信息

    在类创建的对象中,一般都是以字典的方式来保存信息 class Student: def __init__(self, name, age, score): self.name = name self. ...

  6. (转)读懂diff

    http://www.ruanyifeng.com/blog/2012/08/how_to_read_diff.html diff是Unix系统的一个很重要的工具程序. 它用来比较两个文本文件的差异, ...

  7. NET Core 2.2

    .NET Core 2.2 新增部分功能使用尝鲜 https://www.cnblogs.com/viter/p/10070248.html 前言     美国当地时间12月4日,微软2019开发者大 ...

  8. win7如何安装maven、安装protoc

    问题导读1.protoc安装需要安装哪些软件?2.如何验证maven是否安装成功?3.如何验证protoc是否安装成功 ? 一.安装mvaven包 1.首先我们下载maven包 apache-mave ...

  9. 用idea将javaweb项目部署到tomcat

    之前在网上找的一些web项目都是用eclipse开发的,想把这些项目导入到idea中,然后部署到tomcat中,在网上找了很多教程,很多都不靠谱,发现网上很多配置都是多余的,其实很多只需要按idea默 ...

  10. python调用rpc实现分布式系统

    rpc 一般俗称,远程过程调用,把本地的函数,放到远端去调用. 通常我们调用一个方法,譬如: sumadd(10, 20),sumadd方法的具体实现要么是用户自己定义,要么存在于该语言的库函数中,也 ...