计算文档得分的因子: 文档权重(document boost):索引期赋予某个文档的权重值 字段权重(field boost):查询期赋予某个文档的权重值 协调因子(coord):基于文档中词项个数的协调因子,一个文档命中率查询中的词项越多,得分越高 逆文档频率(inverse document frequency):一个基于词项的因子,用来告诉评分公式该词项还有多么罕见,评分公式利用该因子,为包含罕见词项的文档加权 长度范数(length norm):每字段的基于词项个数的归一化因子(在索引期…
一.高亮的一些问题 elasticsearch提供了三种高亮方式,前面我们已经简单的了解了elasticsearch的高亮原理; 高亮处理跟实际使用查询类型有十分紧密的关系,其中主要的一点就是muti term 查询的重写,例如wildcard.prefix等,由于查询本身和高亮都涉及到查询语句的重写,如果两者之间的重写机制不同,那么就可能会碰到以下情况 相同的查询语句, 使用unified和fvh得到的高亮结果是不同的,甚至fvh Highlighter无任何高亮信息返回: 二.数据环境 el…
深入理解ElasticSearch 介绍: 本书涵盖了Elasticsearch的许多中高级功能,并介绍了缓存.ApacheLucene库以及监控等模块的内部运作机制.其中,还涉及一些实用案例,比如配置Elasticsearch参数.使用监控API等. 目录: 前言 第1章 Elasticsearch简介1 1.1 Apache Lucene简介1 1.1.1 熟悉Lucene2 1.1.2 Lucene的总体架构2 1.1.3 分析数据4 1.1.4 Lucene查询语言5 1.2 何为Ela…
关于相关术语的专业解释,请自行百度了解,本文皆本人自己结合参考书和自己的理解所做的阐述,如有不严谨之处,还请多多指教. 事务有四种基本特性,叫ACID,它们分别是: Atomicity-原子性,Consistency-一致性,Isolation-隔离性,Durability-持久性. 接着关于ACID的理解和隔离性语法都是转的网上资料,大家可以顺便再了解熟悉下. 1.原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节.事务执行过程中出错,会回滚到事…
书目 <深入理解ElasticSearch>拉斐尔·酷奇,马雷克·罗戈任斯基[著]张世武,余洪森,商旦[译] 机械工业出版社,2016.1 本系列包括以下8篇笔记 第01章 ElasticSearch简介 第02章 查询DSL进阶 第03章 底层索引控制 第04章 分布式索引架构 第05章 管理ElasticSearch 第06章 故障处理 第07章 改善用户搜索体验 第08章 ElasticSearch Java API 参考资料 [1]Elasticsearch索引的父子关系(index…
elasticsearch 分页查询实现方案 1. from+size 实现分页 from表示从第几行开始,size表示查询多少条文档.from默认为0,size默认为10,注意:size的大小不能超过index.max_result_window这个参数的设置,默认为10,000.如果搜索size大于10000,需要设置index.max_result_window参数 PUT _settings { "index": { "max_result_window":…
ES 常见查询 (1)根据ID 进行单个查询 GetResponse response = client.prepareGet("accounts", "person", "1").setOperationThreaded(false).get(); 相对于sql 的 select * from accounts.person  where id=1 ; (2)分页查询所有记录 QueryBuilder qb=new MatchAllQueryB…
为了演示不同类型的 ElasticSearch 的查询,我们将使用书文档信息的集合(有以下字段:title(标题), authors(作者), summary(摘要), publish_date(发布日期)和 num_reviews(浏览数)). 在这之前,首先我们应该先创建一个新的索引(index),并批量导入一些文档: 创建索引: PUT /bookdb_index { }} 批量上传文档: POST /bookdb_index/book/_bulk { }} { , "publisher&…
公号:码农充电站pro 主页:https://codeshellme.github.io DSL(Domain Specific Language)查询也叫做 Request Body 查询,它比 URI 查询更高阶,能支持更复杂的查询. 1,分页 默认情况下,查询按照算分排序,返回前 10 条记录. ES 也支持分页,分页使用 from-size: from:从第几个文档开始返回,默认为 0. size:返回的文档数,默认为 10. 示例: POST /index_name/_search {…
很多刚学elasticsearch的人对于查询方面很是苦恼,说实话es的查询语法真心不简单-  当然你如果入门之后,会发现elasticsearch的rest api设计是多么有意思. 说正题,elasticsearch的查询有两部分组成:query and filter . 下面是官方的query vs  filter的介绍,其实说的也是不明不白的. https://www.elastic.co/guide/en/elasticsearch/guide/current/_queries_and…