Elasticsearch——Rest API中的常用用法
本篇翻译的是Elasticsearch官方文档中的一些技巧,是使用Elasticsearch必不可少的必备知识,并且适用于所有的Rest Api。
返回数据格式化
当在Rest请求后面添加?pretty
时,结果会以Json格式化的方式显示。另外,如果添加?format=yaml
结果会以树的形式显示,默认都是Flase.
返回数据的易读性
结尾添加?human=true
,返回的数据会有很好的可读性,比如:
- time:3600 会显示为 time:1h
- size:1024 会显示为 1kb
常用的Date Math
在Elasticsearch中日期数学表达式是很常用的,在查询中经常会通过它来作为检索条件,比如range或者daterange。表达式通常会有下面几种操作:
- +1h ,表示加上一个一个小时
- -1d,表示减去一天
- /d,表示向一天取整
支持的单位也很多,比如
- y,代表一年
- M,代表一个月
- w,代表一周
- d,代表一天
- h,代表一个小时
- m,代表一分钟
- s,代表一秒钟
- ms,代表毫秒
举个例子:
- now+1h,表示当前时间加上一个小时,即一个小时后
- now+1h+1m,表示当前时间加上一个小时零一分钟,即一个小时一分钟后
- now+1h/d,表示当前时间加上一个小时,并向一天取整。
- 2015-01-01||+1M/d,2015-01-01加上一个月,并向一天取整
返回的内容过滤
有时候我们可能并不想返回所有的数据,因为这样会浪费一定的空间和时间,因此需要对查询返回的结果进行过滤。所有的API都接受一个参数——filter_path,这个参数支持逗号分隔,可以同时填写多个值。
例如,如果只想要返回查询的时间、事件的id和分值,可以像下面这样:
curl -XGET 'localhost:9200/_search?pretty&filter_path=took,hits.hits._id,hits.hits._score'
{
"took" : 3,
"hits" : {
"hits" : [
{
"_id" : "3640",
"_score" : 1.0
},
{
"_id" : "3642",
"_score" : 1.0
}
]
}
}
也支持*来忽略对某个字段的过滤:
curl -XGET 'localhost:9200/_nodes/stats?filter_path=nodes.*.ho*'
{
"nodes" : {
"lvJHed8uQQu4brS-SXKsNA" : {
"host" : "portable"
}
}
}
使用**则会忽略最大长度的路径,与Spring MVC的Url匹配差不多。
curl 'localhost:9200/_segments?pretty&filter_path=indices.**.version'
{
"indices" : {
"movies" : {
"shards" : {
"0" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ],
"2" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ]
}
},
"books" : {
"shards" : {
"0" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ]
}
}
}
}
注意,elasticsearch一般会直接返回一条数据的原始信息,即_source字段。如果要对_source进行过滤,可以参考下面的用法:
curl -XGET 'localhost:9200/_search?pretty&filter_path=hits.hits._source&_source=title'
{
"hits" : {
"hits" : [ {
"_source":{"title":"Book #2"}
}, {
"_source":{"title":"Book #1"}
}, {
"_source":{"title":"Book #3"}
} ]
}
}
扁平化
设置flat_settings 为true,会以扁平化的方式返回数据:
{
"persistent" : { },
"transient" : {
"discovery.zen.minimum_master_nodes" : "1"
}
}
关于参数
在Elastcisearch的使用中,往往要接触到各种数据类型。如果某个字段设置了固定的类型,那么当执行查询或者索引时,一些数据会发生自动的类型转换。
Boolean
在Es中,false、no、0、off这些值都代表false,其他的值都是true.
Number
所有的API都支持以字符串的方式代表JSON中的数字类型。
Date
支持的类型上面都说过了...
Geo
Geo类型主要用于地图一类的数据,这里就先不介绍了。使用方法可以参考
模糊查询
有的时候一些需要允许一定的模糊度,比如检索hallo可以查询到hello,这就要支持模糊查询。模糊查询可以使用fuzziness参数,它有点像range:
-fuzziness <= fieldValue <= +fuzziness
并且可以设置一定的模糊度,比如:
- 0,1,2 设置它的编辑距离(levenshtein distance,wiki)
- AUTO,如果设置Auto,那么会根据字符串的长度而改变
比如,长度为:
0..2
,必须完全匹配3..5
,可以有一个编辑距离的模糊度>5
,可以有两个编辑距离的模糊度
返回结果——驼峰式
所有的API都接受一个case参数,如果设置为camelCase,那么所有的名称都会以驼峰式的形式返回。
查询的请求体
除了POST请求外,其他的请求时没有请求体的。这个时候如果要执行查询,可以把参数放在Url后面。
参考
1 官方文档
2 编辑距离,wiki百科
Elasticsearch——Rest API中的常用用法的更多相关文章
- golang中type常用用法
golang中,type是非常重要的关键字,一般常见用法就是定义结构,接口等,但是type还有很多其它的用法,在学习中遇到了以下几种,这点简单总结记录下 定义结构 type Person struct ...
- java string中indexOf()常用用法
Java中字符串中子串的查找共有四种方法,如下: 1.int indexOf(String str) :返回第一次出现的指定子字符串在此字符串中的索引. 2.int indexOf(String st ...
- Web API中常用Filter的执行顺序举例讲解
在WEB Api中,引入了面向切面编程(AOP)的思想,在某些特定的位置可以插入特定的Filter进行过程拦截处理.引入了这一机制可以更好地践行DRY(Don’t Repeat Yourself)思想 ...
- java-API中的常用类,新特性之-泛型,高级For循环,可变参数
API中的常用类 System类System类包含一些有用的类字段和方法.它不能被实例化.属性和方法都是静态的. out,标准输出,默认打印在控制台上.通过和PrintStream打印流中的方法组合构 ...
- WPF中的常用布局 栈的实现 一个关于素数的神奇性质 C# defualt关键字默认值用法 接口通俗理解 C# Json序列化和反序列化 ASP.NET CORE系列【五】webapi整理以及RESTful风格化
WPF中的常用布局 一 写在开头1.1 写在开头微软是一家伟大的公司.评价一门技术的好坏得看具体的需求,没有哪门技术是面面俱到地好,应该抛弃对微软和微软的技术的偏见. 1.2 本文内容本文主要内容 ...
- JavaWeb学习之JDBC API中常用的接口和类
JDBC API中包含四个常用的接口和一个类分别是: 1.Connection接口 2.Statement接口 3.PreparedStatement接口 4.ResultSet接口 5.Driver ...
- Java集合中迭代器的常用用法
该例子展示了一个Java集合中迭代器的常用用法public class LinkedListTest { public static void main(String[] args) { List&l ...
- Elasticsearch java api 常用查询方法QueryBuilder构造举例
转载:http://m.blog.csdn.net/u012546526/article/details/74184769 Elasticsearch java api 常用查询方法QueryBuil ...
- 大数据(5) - HDFS中的常用API操作
一.安装java 二.IntelliJ IDEA(2018)安装和破解与初期配置 参考链接 1.进入官网下载IntelliJ IDEA https://www.jetbrains.com/idea/d ...
随机推荐
- 黑马程序员+ADO.Net基础(上)
---------------<a href="http://edu.csdn.net"target="blank">ASP.Net+Android ...
- <2048>游戏问卷调查心得与体会
这是我的首次做问卷调查,刚开始感到不知所措,不知道该怎么去完成它,但是其中也充满了所谓的新鲜感,以前总是填别人做的问卷调查,但是现在是我们小组自己讨论得到的一张属于自己的问卷,可以说感受很深,一张小小 ...
- Unity3D shader简介
Unity3D shader简介 可以肯定的说Unity3D使得很多开发者开发游戏更容易.毫无疑问,shader(着色器)编码,仍有很长的路要走.shader是一个专门运行在GPU的程序,经常被神秘包 ...
- Java多线程系列--“JUC锁”07之 LockSupport
概述 本章介绍JUC(java.util.concurrent)包中的LockSupport.内容包括:LockSupport介绍LockSupport函数列表LockSupport参考代码(基于JD ...
- 十进制数转化成二进制后包含一的数量(c++)
#include <iostream> using namespace std;int func(int x){ int count=0; while(x){ ...
- 虚拟化平台cloudstack(7)——新版本的调试
调试环境 ubuntu 12.04 JDK1.7 apache-maven-3.10 eclipse 4.2 Juno mysql 5 源码下载及调试 上面的几个软件在上一篇中已经介绍了. 在新的版本 ...
- C# 加密–RSA前端与后台的加密&解密
1. 前言 本问是根据网上很多文章的总结得到的. 2. 介绍 RSA加密算法是一种非对称加密算法. 对极大整数做因数分解的难度决定了RSA算法的可靠性.换言之,对一极大整数做因数分解愈困难,RSA算法 ...
- Java基础之多线程
1.进程和线程: 进程:正在进行的程序.每一个进程执行都有一个执行顺序,该顺序是一个执行路径,或者叫一个控制单元. 线程:进程内部的一条执行路径或者一个控制单元. 两者的区别: 一个进程至少有一个线程 ...
- Oracle数据库分页的三种方法
-- 不能对ROWNUM使用>(大于1的数值).>=(大于或等于1的数值).=(大于或等于1的数值),否则无结果-- 所以直接用只能从1开始-- rownum >10 没有记录,因为 ...
- MySQL 5.7新特性之Generated Column(函数索引)
MySQL 5.7引入了Generated Column,这篇文章简单地介绍了Generated Column的使用方法和注意事项,为读者了解MySQL 5.7提供一个快速的.完整的教程.这篇文章围绕 ...