_score的计算方式

score(q,d)  =    # score(q,d) 是文档 d 与查询 q 的相关度评分。

          · queryNorm(q)      # 查询归一化因子，用来使查询结果之间能够相互比较，但意义不大，因为_score的目的并不是对不同查询进行比较，而是用来对查询结果进行排序

          · coord(q,d)        # 协调因子，对于多词查询，文档里出现的匹配词越多，该值越大。 bool查询也遵循这个规则。Lucene中同义词查询会自动禁用这个值（优秀！）。

          · ∑ (

              · tf(t in d)

              · idf(t)²

              · t.getBoost()

              · norm(t,d)

            ) (t in q)

原文

优化查询结果的方法

设置boost参数在一个查询上、某些索引上
使用查询结构修改相关度
使用boosting查询，对包含不想要的词的查询结果进行降级
function_score查询：这个查询可以使两个效果融合：可以仍然根据全文相关度进行排序，但也会同时考虑最新发布文档、流行文档、或接近用户希望价格的产品。

3.1 field_value_factor：需要有一个专门的字段，存储数值，以这个数值进行调试

3.2 functions：可以用来对不同搜索词加权

3.3

Elasticsearch相关度评分_score的更多相关文章

Elasticsearch由浅入深（十）搜索引擎：相关度评分 TF&IDF算法、doc value正排索引、解密query、fetch phrase原理、Bouncing Results问题、基于scoll技术滚动搜索大量数据
相关度评分 TF&IDF算法 Elasticsearch的相关度评分(relevance score)算法采用的是term frequency/inverse document frequen ...
ElasticSearch7.3学习(二十四)----相关度评分机制详解
1.算法介绍 relevance score(相关性分数) 算法,简单来说,就是计算出,一个索引中的文本,与搜索文本,他们之间的关联匹配程度.Elasticsearch使用的是 term freque ...
Elasticsearch学习之相关度评分TF&IDF
relevance score算法,简单来说,就是计算出,一个索引中的文本,与搜索文本,他们之间的关联匹配程度 Elasticsearch使用的是 term frequency/inverse doc ...
elasticsearch查询之keyword字段的查询相关度评分控制
一.数据情况 purchase记录每个用户的购买信息: PUT purchase { "mappings":{ "properties":{ "id& ...
ES搜索排序，文档相关度评分介绍——Vector Space Model
Vector Space Model The vector space model provides a way of comparing a multiterm query against a do ...
ES搜索排序，文档相关度评分介绍——TF-IDF—term frequency, inverse document frequency, and field-length norm—are calculated and stored at index time.
Theory Behind Relevance Scoring Lucene (and thus Elasticsearch) uses the Boolean model to find match ...
ES搜索排序，文档相关度评分介绍——Field-length norm
Field-length norm How long is the field? The shorter the field, the higher the weight. If a term app ...
elasticsearch 深入 —— 相关度控制
控制相关度处理结构化数据(比如:时间.数字.字符串.枚举)的数据库, 只需检查文档(或关系数据库里的行)是否与查询匹配. 布尔的是/非匹配是全文搜索的基础,但不止如此,我们还要知道每个文档与查询的相 ...
ElasticSearch快速指南
ElasticSearch是基于Apache Lucene的分布式搜索引擎, 提供面向文档的搜索服务. 安装ElasticSearch 文档创建文档访问文档更新文档删除文档索引分析器类型 ...

随机推荐

halcon保存带有region的图片算子
显示带区域的图片除了可以用dev_display挨个显示外再截图,还可以通过一个算子来实现这一功能这个算子是:dump_window_image.(其实就是截图) 这个算子的意思是把WindowHa ...
Tomcat8.0.36安装配置
1.下载tomcat8.0.36 下载地址:http://tomcat.apache.org/download-80.cgi 2.解压至C:\Program Files\tomcat8下 3.添加系 ...
CDH4.5.0下安装snappy
编译源代码 http://www.cnblogs.com/chengxin1982/p/3862289.html 测试参考 http://blog.jeoygin.org/2012/03/java-c ...
第49章在SRAM中调试代码—零死角玩转STM32-F429系列
第49章在SRAM中调试代码全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.com/fir ...
javascript入门笔记7-计时器
计时器语法: setInterval(代码,交互时间) 参数说明: 代码:要调用的函数或要执行的代码串. 交互时间:周期性执行或调用表达式之间的时间间隔,以毫秒计(1s=1000ms). 例子: & ...
java基础序列化反序列化流实现Serializable 接口自动装载序列号到对象文本文件如修改不能反序列化对象文本,除非自定义long型常量打印流
package com.swift.baseKnowledge; import java.io.File; import java.io.FileInputStream; import java.io ...
谈谈两种标准库类型---string和vector
两种最重要的标准库---string和vector string和vector是两种最重要的标准库类型,string表示可变长的字符序列,vector存放的是某种给定类型对象的可变长序列. 一.标准库 ...
聊聊我这两年都在忙什么，IT技术男如何转型！
从09年开始,从事软件测试工作:至今六年有余: 从当初的简单的功能测试,到后来的整体系统测试,性能测试,至公司测试负责人: 我常常在想,IT技术男,有哪些转型机会,是不是得一辈子从事测试这个职业(注: ...
路由器基础配置之单臂路由实现vlan间通信
我们将以上面的拓扑图开始进行配置,目的为设置单臂路由实现vlan间通信,设置4个vlan,pc0,1,2为vlan10 pc3,4,5为vlan20:pc6,7,8为vlan30:server0,1为 ...
linux下载利器之curl和wget的区别
linux下载利器-------curl和wget的区别 curl和wget基础功能有诸多重叠,如下载等. 在高级用途上的curl由于可自定义各种请求参数所以长于模拟web请求,用于测试网页交互(浏览 ...

Elasticsearch相关度评分_score

相关度评分 _score 的目的

_score的计算方式

优化查询结果的方法

Elasticsearch相关度评分_score的更多相关文章

随机推荐

热门专题