#新建索引以及类型:
PUT http://10.18.43.3:9200/test
{
"settings": {
"number_of_shards": 3,
"number_of_replicas": 0
},
"mappings": {
"type1": {
"properties": {
"id": {
"type": "long"
},
"ukey": {
"type": "keyword"
},
"startid": {
"type": "long"
},
"title": {
"type": "text"
},
"fetch_time": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
}
}
}
}
}
keyword类型的字段是不可切分的,text可以分词 #插入数据: PUT http://10.18.43.3:9200/test/type1/1
{
"key": value,
"key2": value2
}
,如果需要自动生成id,需要把方法改成POST,然后把url改成http://10.18.43.3:9200/test/type1 #更新数据
POST http://10.18.43.3:9200/test222/type1/1/_update
{
"doc": {
"content":"更新content2"
} }
更新数据需要用POST方法而且后面要加_update,更新的字段要包含在 doc 字段里面 #删除数据
DELETE http://10.18.43.3:9200/test/type1/1 #删除索引
DELETE http://10.18.43.3:9200/test #简单查询
GET http://10.18.43.3:9200/test/type1/1 #条件查询
POST http://10.18.43.3:9200/test/_search
{
"query": {
"match_all": {}
},
"from": 1,
"size": 2
}
from 是从哪一行开始,size 是查询显示多少条 POST http://10.18.43.3:9200/test/_search
{
"query": {
"match": {
"html_snapshot": "医生"
}
},
"sort": [
{
"id": {
"order": "desc"
}
}
]
}
查询所有html_snapshot包含"医生"的数据,类似于模糊查询(查询html_snapshot包含"医生"的数据),需要注意这个模糊匹配会把查询条件再次分词,如
条件为"html_snapshot": "医生和护士"的话,那么很可能会分成"医生","护士"两个词来分别匹配,如果需要像SQL那样 %xxx%这种形式的模糊匹配的话,
那么需要把 "match"改为"match_phrase",这样如果匹配"医生和护士",那么会匹配里面包含 xxx医生和护士xxxx 这种类型的数据
这儿html_snapshot是text类型,如果是keyword类型的话查询结果是精确查询的结果(查询html_snapshot等于"医生"的数据)
按照id降序排列 POST http://10.18.43.3:9200/test/_search
{
"query": {
"query_string": {
"query": "(非常感谢 AND 医院) OR 医生",
"fields": ["html_snapshot", "content"]
}
}
}
查询多个字段,这样查询也是会先自动分词然后进行匹配 POST http://10.18.43.3:9200/test/_search
{
"query": {
"term": {
"startid": 2
}
}
}
精确查询 startid == 2 POST http://10.18.43.3:9200/test/_search
{
"query": {
"range": {
"startid": {
"gte": 2,
"lte": 3
}
}
}
}
startid 大于等于2,小于等于3的数据 POST http://10.18.43.3:9200/test/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"startid": 2
}
},
{
"match": {
"html_snapshot": "客气"
}
}
]
}
}
}
查询 startid必须为2(因为是keyword类型) 和 html_snapshot必须包含(text类型)"客气" 的所有数据 #聚合查询
POST http://10.18.43.3:9200/test/_search
{
"aggs": {
"group_by_startid": {
"terms": {
"field": "startid",
"size": 3
}
}
}
}
根据startid统计所有数据count,返回统计结果前3的聚合数据,size是显示3条聚合数据
可以同时统计多组聚合信息 POST http://10.18.43.3:9200/test/_search
{
"aggs": {
"group_by_startid": {
"stats": {
"field": "startid"
}
}
}
}
stats是计算聚合关键字,里面有startid的总数,最大值最小值平均值总和等数据

##Elasticsearch 使用bool 子句来将各种子查询关联起来,组成布尔表达式,bool 子句可以随意组合、嵌套。

bool子句主要包括:

must:表示必须匹配。
must_not:表示一定不能匹配。
should:表示可以匹配,类似于布尔运算里的”或”。如果bool 子句里,没有must子句,那么,should子句里至少匹配一个,如果有must子句,那么,should子句至少匹配零个。可以使用minimum_should_match 来对最小匹配数进行设置。

====================================ES的快照备份查询与恢复===========================================

索引的快照过程是增量的。在创建索引快照的过程中,ElasticSearch会分析仓库中已经存在的索引文件,只拷贝那些在最后一次快照之后被创建或者更新的文件。That allows multiple snapshots to be preserved in the repository in a compact form. 快照过程以非阻塞的方式执行,所有的索引和搜索操作都可以对正在被创建快照的索引继续执行。一个快照表示的是这个索引在快照被创建时间点的索引视图,所以在索引过程开始之后被添加到索引中的记录不会出现在快照中。
(参考 https://blog.csdn.net/ale2012/article/details/82702128#_126)

需要先在elasticsearch.yml中加入  path.repo: /usr/local/backups 这个配置来配置备份文件夹 文件夹权限要设置为777

1. 创建快照仓库, 名字为all_backup
http://10.1.1.112:9200/_snapshot/all_backup PUT
{
"type": "fs",
"settings": {
"location": "/usr/local/backups/all_backup"
}
} 2. 备份快照,快照名字v2019-7-2
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2?wait_for_completion=true PUT 如果只需要备份某几个索引可以加上:

{
"indices": "article"
}


3. 查询快照
http://10.1.1.112:9200/_snapshot/all_backup/* GET 4. 恢复快照
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2/_restore POST

ElasticSearch : 基础的更多相关文章

  1. ELK(elasticsearch+kibana+logstash)搜索引擎(二): elasticsearch基础教程

    1.elasticsearch的结构 首先elasticsearch目前的结构为 /index/type/id  id对应的就是存储的文档ID,elasticsearch一般将数据以JSON格式存储. ...

  2. Elasticsearch 基础入门

    原文地址:Elasticsearch 基础入门 博客地址:http://www.extlight.com 一.什么是 ElasticSearch ElasticSearch是一个基于 Lucene 的 ...

  3. ElasticSearch 基础 1

    ElasticSearch 基础=============================== 索引创建 ========================== 1. RESTFUL APIAPI 基本 ...

  4. Elasticsearch基础但非常有用的功能之二:模板

    文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484584&idx=1&sn=accfb65 ...

  5. 最完整的Elasticsearch 基础教程

    翻译:潘飞(tinylambda@gmail.com) 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT)        Ela ...

  6. ELK 之一:ElasticSearch 基础和集群搭建

    一:需求及基础: 场景: 1.开发人员不能登录线上服务器查看详细日志 2.各个系统都有日志,日志数据分散难以查找 3.日志数据量大,查询速度慢,或者数据不够实时 4.一个调用会涉及到多个系统,难以在这 ...

  7. Elasticsearch基础教程

    Reference: http://blog.csdn.net/cnweike/article/details/33736429 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概 ...

  8. elasticsearch基础概念

    接近实时(NRT)        Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒).           集群(clu ...

  9. Elasticsearch基础知识分享

    1. Elasticsearch背景介绍 Elasticsearch 是一个基于 Lucene 的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口.Elast ...

  10. Elasticsearch基础教程分享

    基础及相关资料 首先我们先了解一下什么是Elastisearch,Elasticsearch(简称es)是一个基于Lucene库的搜索引擎.它提供了一个分布式.支持多租户的全文搜索引擎,具有HTTP  ...

随机推荐

  1. PLSQL Developer中几个功能

    1,登录后默认自动选中My Objects 默认情况下,PLSQL Developer登录后,Brower里会选择All objects,如果你登录的用户是dba,要展开tables目录,正常情况都需 ...

  2. 在crontab中执行脚本重要事项

    crontab不能成功执行shell脚本的可能原因 crond进程不存在,该进程是crontab的守护进程,它必须存在才能让crontab正常使用: 系统时间不对: 环境变量的问题:crontab执行 ...

  3. Selenium 2.0 以后不在必须Selenium server了

    does not require the Selenium Server to automate the browser.这个句话,解决了我很的疑惑,新版Selenium 可以直接操作浏览器了,还可以 ...

  4. Third week-homework(员工管理系统)

    需求: 可以查询员工所有信息 可以修改员工信息 可以增加新员工 code: import sys,json # yuangong = { # "1": ["faker&q ...

  5. elasticsearch 概念

    elasticsearch 来源:https://baike.baidu.com/item/elasticsearch/3411206?fr=aladdin ElasticSearch是一个基于Luc ...

  6. react-webpack-express

    这是一个整合react express 实现前后台交互,并且采用webpack进行打包和解析文件.其实react官方有一个脚手架create react app,也可以看那个,但是这个脚手架webpa ...

  7. (转)sizeof()和_countof()

    (转)sizeof()和_countof()   先看程序: #include <iostream> using namespace std; int main(int argc, cha ...

  8. Android 回调的理解,觉得写得好就转过来。。。收藏一下

    转自:一个经典例子让你彻彻底底理解java回调机制 以前不理解什么叫回调,天天听人家说加一个回调方法啥的,心里想我草,什么叫回调方法啊?然后自己就在网上找啊找啊找,找了很多也不是很明白,现在知道了,所 ...

  9. IOS MapKit框架的使用(专门用于地图显示)

    ● MapKit框架使用前提 ● 导入框架 ● 导入主头文件#import <MapKit/MapKit.h>   ●  MapKit框架使用须知 ●  MapKit框架中所有数据类型的前 ...

  10. Python 用多线程上传和下载文件

    # -*- coding: utf-8 -*- __author__ = 'louis' from ftplib import FTP import multiprocessing import ti ...