背景

  我本来是想把我的写的es的平时总结dsl发出来的,但是我发现只搞那个意义大不.干脆多写点吧.

索引的结构化和非结构

  我们经常用数据库,当然会经常用到索引.

  然后从索引的维度去分析,系统分为结构化索引和非结构化索引.

  结构化索引,就是可以预设索引,比如id,可以预见的. 维护方便,性能高.

  非结构化索引,就是数据进来之前,我可能都不知道要进来什么. 然后数据进来后,我要进行分析. 比如,挨个扫描节点,看是否包含,比较墨迹. 或者将非结构化的数据的一部分信息提取出来,使其变得有结构,感觉很像抽象,有了结构,那就好搞很多.

elasticSearch简述

elasticSearch又称es,是一种分布式的搜索引擎工具,之前我们比较熟悉的应该是luence,然后再往前推进,就是solr;

三者的关系

luence是一个信息检索工具包,类似SDK,提供了全面的api,也可以做高级查询.但是作为一个搜索引擎来讲的话,并不太完整,因为缺乏了一些获取数据,解析,分词等功能.而且,用起来较为复杂.所以,我们可能更需要完整而且更简洁的搜索引用服务. 简而言之,很全面,很基础,用起来麻烦.

solr是基于luence,是对lucen的进一步封装,补全.提供了对应的api供我们调用,很容易就能实现检索服务,而且更为完整,可以根据配置文件解析数据等.但是因为是更高一层的封装,所以luence很多新特性不能及时透传,也就是luence能查,但是solr查不了.简而言之,solr是独立的,面向企业级的,搜索引擎.

es也是基于luence,并提供了更高层次的封装的搜索引擎.特点对索引进行分片,将一个大的索引拆分多个,分布到不同节点上,降低服务器压力,构成分布式搜索,从大大提升搜索效率.是一款近乎实时分析的搜索引擎,非常强力.而且采用了restful风格,更易于上手.简而言之,分片机制,分布式搜索,实时,很强力.

实际开发中的dsl语句

记得装了es之后,再装个kibana,然后再kibana上跑这些程序.

#处理下hyd_test的全文导入
DELETE hyd_test GET /hyd_test/_doc/_search

#批量更新
  POST /hyd_test/_doc/_bulk
  {"update":{"_id":1}}
  {"doc":{"reference_law":"《中华人民共和国民事诉讼法》第二百一十条 、第二百三十三条 、第二百零七条 、第一百七十条","trial_court":"最高人民法院","assistan t_judge":"齐召财","clerk":"齐召财","lawyer":"","law_firm":"","legal_basis":"","created_time":"2020-09-02 15:32:00","created_by":"admi  n","updated_time":"2020-09-02 15:34:12","updated_by":"","is_delete":0},"doc_as_upsert":true}

#批量写入
POST test_demo/_doc/_bulk
{"create":{"_id":1}}
{"case_name":"你好你好 ,嗨美女","count":18}
{"create":{"_id":2}}
{"case_name":"好的好的,大美女","count":19} #查询结构
GET /test_demo/_mapping #查询分词_analyze
POST /test_demo/_analyze
{
"analyzer": "ik_max_word",
"text": "你好你好 ,嗨美女"
} #match查询
GET /test_demo/_doc/_search
{
"query": {
"match": {
"case_name": {
"query": "是个美女"
}
}
}
} #精确匹配term
GET /test_demo/_doc/_search
{
"query": {
"term": {
"case_name": {
"value": "是个美女"
}
}
}
} #and 查询
GET hyd_test/_search
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"match": {
"trial_year": "2018"
}
},
{
"match": {
"case_cause_id": "100"
}
}
]
}
}
}
#统计
GET hyd_test/_search
{
"size": 0,
"query": {
"match": {
"case_cause_name": "相邻通行纠纷"
}
},
"aggs": { "document_type_name":{
"terms": {
"field": "document_type_name",
"size": 10
}
}
}
} #清空所有数据
POST authoritative_case/_delete_by_query
{
"query":{
"match_all":{ }
}
} #高亮. 注意, 高亮必须match也要带上同样的字段.
GET hyd_test/_search
{ "query": {
"match": {
"case_cause_name": "相邻通行纠纷"
}
},
"highlight": {
"fields": {
"case_cause_name":{ }
}
} } #高亮,加颜色,并且不要求 number_of_fragments 分段. 默认为5 ,就是划分为5断.
GET hyd_test/_search
{
"query": {
"bool": {
"must": [
{
"query_string": {
"query": "一审"
}
},
{
"match": {
"id": {
"query": 1
}
}
}
]
}
},
"highlight": {
"pre_tags": [
"<span style='color:red'>"
],
"post_tags": [
"</span>"
],
"fragment_size": 1000,
"number_of_fragments": 0,
"require_field_match": false,
"fields": {
"*": {}
}
}
} #id为1的全文高亮
GET hyd_test/_search
{
"query": {
"bool": {
"must": [
{
"query_string": {
"query": "民事"
}
},
{
"query_string": {
"query": "理由"
}
},
{
"match": {
"id": "1"
}
}
]
}
},
"highlight": {
"require_field_match": "false",
"fields": {
"*": {}
}
}
} #查询嵌套对象: path里面是对象visible_user query最里面是实际字段visible_user.visible_user_id
GET gzmx_clue/_search
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"nested": {
"path": "visible_user",
"query": {
"terms": {
"visible_user.visible_user_id": [
185
]
}
}
}
}
]
}
}
} #复杂查询 先取交集,再取并集. should(must,must) .
GET gzmx_clue/_search
{
"query": {
"bool": {
"should": [
{
"bool": {
"must": {
"match": {
"procuratorate_code": "2"
}
},
"must_not": {
"match": {
"source": "9"
}
}
}
},
{
"bool": {
"must": [
{
"match": {
"source": "9"
}
},
{
"nested": {
"path": "visible_user",
"query": {
"terms": {
"visible_user.visible_user_id": [
186
]
}
}
}
},
{
"match": {
"procuratorate_code": "2"
}
}
]
}
}
]
}
}
} #must和shoule交集使用会导致should不起效. 所以, 尽量把should放在must里面.
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"terms": {
"clue_feature": [
"0"
],
"boost": 1
}
},
{
"bool": {
"should": [
{
"bool": {
"must": [
{
"match": {
"procuratorate_code": {
"query": 2,
"operator": "OR",
"prefix_length": 0,
"max_expansions": 50,
"fuzzy_transpositions": true,
"lenient": false,
"zero_terms_query": "NONE",
"auto_generate_synonyms_phrase_query": true,
"boost": 1
}
}
}
],
"must_not": [
{
"match": {
"source": {
"query": 9,
"operator": "OR",
"prefix_length": 0,
"max_expansions": 50,
"fuzzy_transpositions": true,
"lenient": false,
"zero_terms_query": "NONE",
"auto_generate_synonyms_phrase_query": true,
"boost": 1
}
}
}
],
"adjust_pure_negative": true,
"boost": 1
}
},
{
"bool": {
"must": [
{
"nested": {
"query": {
"terms": {
"visible_user.visible_user_id": [
432
],
"boost": 1
}
},
"path": "visible_user",
"ignore_unmapped": false,
"score_mode": "none",
"boost": 1
}
},
{
"match": {
"procuratorate_code": {
"query": 2,
"operator": "OR",
"prefix_length": 0,
"max_expansions": 50,
"fuzzy_transpositions": true,
"lenient": false,
"zero_terms_query": "NONE",
"auto_generate_synonyms_phrase_query": true,
"boost": 1
}
}
},
{
"match": {
"source": {
"query": 9,
"operator": "OR",
"prefix_length": 0,
"max_expansions": 50,
"fuzzy_transpositions": true,
"lenient": false,
"zero_terms_query": "NONE",
"auto_generate_synonyms_phrase_query": true,
"boost": 1
}
}
}
],
"adjust_pure_negative": true,
"boost": 1
}
}
],
"adjust_pure_negative": true,
"boost": 1
}
}
],
"adjust_pure_negative": true,
"boost": 1
}
},
"sort": [
{
"created_time": {
"order": "desc"
}
},
{
"id": {
"order": "desc"
}
}
],
"track_total_hits": 2147483647
}
#查询所有数量
GET gzmx_clue/_search
{
"track_total_hits":true,
"query":{
"match_all":{}
}
}

elasticsearch相关概念及常用操作汇总的更多相关文章

  1. Kotlin——初级篇(八):关于字符串(String)常用操作汇总

    在前面讲解Kotlin数据类型的时候,提到了字符串类型,当然关于其定义在前面的章节中已经讲解过了.对Kotlin中的数据类型不清楚的同学.请参考Kotlin--初级篇(三):数据类型详解这篇文章. 在 ...

  2. Kotlin——关于字符串(String)常用操作汇总

    在前面讲解Kotlin数据类型的时候,提到了字符串类型,当然关于其定义在前面的章节中已经讲解过了.对Kotlin中的数据类型不清楚的同学.请参考Kotlin——初级篇(三):数据类型详解这篇文章. 在 ...

  3. ElasticSearch 集群基本概念及常用操作汇总(建议收藏)

    内容来源于本人的印象笔记,简单汇总后发布到博客上,供大家需要时参考使用. 原创声明:作者:Arnold.zhao 博客园地址:https://www.cnblogs.com/zh94 目录: Elas ...

  4. Git常用操作汇总(转)

    如果一个文件被删除了,可以使用切换版本号进行恢复.恢复方法: 先确定需要恢复的文件要恢复成哪一个历史版本(commit),假设那个版本号是: commit_id,那么 git checkout com ...

  5. Elasticsearch(Transport Client)常用操作

    这里描述操作elasticsearch采用TransportClient这种方式,官方明确表示在ES 7.0版本中将弃用TransportClient客户端,且在8.0版本中完全移除它. 记录一些常用 ...

  6. ElasticSearch之映射常用操作

    本文案例操作,建议先阅读我之前的文章<ElasticSearch之安装及基本操作API> Mapping (映射)类似关系型数据库中的表的结构定义.我们将数据以 JSON 格式存入到 El ...

  7. ListControl常用操作汇总

    本文根据本人在项目中的应用,来谈谈CListCtrl的部分用法及技巧.当初学习时,查了很多资料,零零碎碎的作了些记录,现在主要是来做个总结,方便以后查阅.主要包括以下十三点内容:基本操作.获取选中行的 ...

  8. ssh下常用操作汇总(good)

    1. 安装git,从程序目录打开 "Git Bash"  2. 键入命令:ssh-keygen -t rsa -C "email@email.com"   &q ...

  9. ElasticSearch相关概念与客户端操作

    一.Elasticsearch概述 Elasticsearch是面向文档(document oriented)的,这意味着它可以存储整个对象或文档(document).然而它不仅仅是存储,还会索引(i ...

  10. Linux下常用操作汇总

    查看linux操作系统位数 (1) 终端输入: file /sbin/init 如 显示: /sbin/init: ELF 32-bit LSB executable, Intel 80386, ve ...

随机推荐

  1. 解决.net Core中WebApi自动Model验证导致数据格式不能统一

    简言: 最近做项目用WebAPI Core时,想把返回数据的格式,统一弄成:{"errorMsg":"xxx","Data":"x ...

  2. python函数及算法

    算法二分法 二分算法图 什么是算法? ​ 算法是高效解决问题的办法. 需求:有一个按照从小到大顺序排列的数字列表,查找某一个数字 # 定义一个无序的列表 nums = [3,4,5,67,8,9,12 ...

  3. 使用.NET开发搭建OpenAI模型的中间服务端

    前言:前不久微信上大家玩ChatGPT聊天机器人玩的不亦乐乎:不过随着ChatGPT被封杀,所以用微信聊天机器人有可能导致封号的风险.那如果自己不想每次都去OpenAI官网上进行对话[PS:官网上面聊 ...

  4. 重学c#系列——元组 [三十一]

    前言 元组并不是c# 7.0的东西,早之前就有,叫做tuple.7.0加了valuetuple. 来看下元组吧,主要一些注意的地方. 正文 为什么在7.0 之前,元组用的不多呢? 因为tuple 在代 ...

  5. JavaScript:如何知道一个变量的数据类型?:typeof

    使用typeof去查看一个变量的数据类型,如下图所示,展示了JS的七大基础数据类型和对象: 这里有必要提一下: 函数也是一个对象,但是函数的特殊性,使得在使用typeof去判断其类型的时候,会输出fu ...

  6. JavaFx 页面和控件设置快捷键

    原文:JavaFx 页面和控件设置快捷键 - Stars-One的杂货小窝 之前说过一篇window系统全局快捷键的设置,本期主要是讲解JavaFx应用程序的快捷键设置,还是有所区别的 这里主要是To ...

  7. effective-c 条款2理解与思考

    尽量使用const,enum,inline替换 #define 因为,#define 替换发生在预处理阶段,编译器对这个替换内容就缺少了类型检测,并且不利于错误信息的查看 编译器再声明数组时必须知道数 ...

  8. 【大型软件开发】浅谈大型Qt软件开发(三)QtActive Server如何通过COM口传递自定义结构体?如何通过一个COM口来获得所有COM接口?

    前言 最近我们项目部的核心产品正在进行重构,然后又是年底了,除了开发工作之外项目并不紧急,加上加班时间混不够了....所以就忙里偷闲把整个项目的开发思路聊一下,以供参考. 鉴于接下来的一年我要进行这个 ...

  9. 在腾讯云上创建一个玩具docker-mysql数据服务

    有时候开发需求会自己做一下测试数据,在自己电脑本地安装的服务多了电脑环境会搞的很乱,这时使用云服务器安装个docker服务是一个不错的寻找. 下面步骤是在腾讯云上安装docker-mysql镜像,并导 ...

  10. Java微服务随机掉线排查思路

    背景 我们的业务共使用11台(阿里云)服务器,使用SpringcloudAlibaba构建微服务集群,共计60个微服务,全部注册在同一个Nacos集群 流量转发路径: nginx->spring ...