solr特点三: 基于Solr实现排序定制化参考

排序实现有N种形式，最低成本、最快响应时间是目标
一份索引，支持N种排序策略并且在线互不干扰是要考虑的
每一种实现，处理的场景是不同的，不要千篇一律

020排序，从索引到效果，有不少坑，这篇文章没有细说，原因是有些内容不好公开

几点基础概念回顾
（1）排序定制化不同于实现业务排序。

实现业务排序可以是查阶段，通过boost、各种func 组合、离线score等单独或者组合实现排序目标，

或者索引构建阶段的 field boost、document boost

或者索引构建阶段的postion、freq、length等的处理

或者干预vsm、

或者实现自己的function，

或者自定义queryparser引入自定义的query和相关weight、score等。

或者自定义querycomponent，然后彻底从query链路调整查询和排序

或者以上的组合

（2）排序定制化

这里特指solr已经默认自带的排序机制，默认vsm、默认sortbyField、默认的function集合包括他们的组合、

默认的booleanquery、phrasequery、luceneparser、dismax parser等
都不能满足排序需求的。

然后需要开口子，引入自己的排序。

（3）排序是动态的过程

绝对不是一次设置，永久有效的。随着数据集的变化、业务场景的变化、市场的变化等因素，排序只是阶段

性满足业务需求。这意味着排序是不间断的过程，没有最好，只有更好。

（4）排序是 one doc one score just

这里是说获取到了doc，就获取了这个doc的得分，doc的得分只关联这个doc自身的内容。间接的意思，每个doc的得分是自身闭包的，与其他doc的得分情况无关。

基于solr实现排序定制的几种有效、低成本实现
（1）简单、直接的 extends
ValueSourceParser
在solrconfig.xml
中配置自己的valueSourceParser，查询结点通过name 对应的关键词调用相关排序。
作用域是在查询中设置，需要的时候就启用
eg 配置

查询
query.add("sort", "sortRank(id@itemType)
asc");

（2）vsm bm25 的参数调整 extends SimilarityFactory{

配置在schema.xml中，作用域是整个solrcore。

（3）SearchComponent 的重写 extends SearchComponent
   这里面可以实现
默认排序+topN的二次排序；或者直接定义自己的排序

这里面的实现是深度的干预查询链路，甚至cache。
   这里的干预设计到shard请求，需要仔细验证

这里的干预有的需要parser的干预联合，用来解析参数
   关于o2o个性化排序，建议走这个模式

（4）关于o2o个性化排序

schema的配置：距离算法、距离精度

排序策略：过滤优先 or 结果优先 or 速度优先，然后会有不同角度的平衡

涉及具体业务细节和排序公式，这里省略 1w字

solr特点三: 基于Solr实现排序定制化参考的更多相关文章

网易云基于 Kubernetes 的深度定制化实践
本文由网易云发布. 2017 年,Kubernetes 超越 Mesos 和 Docker Swarm成为最受欢迎的容器编排技术.网易云从 2015 下半年开始向 Kubernetes 社区贡献代 ...
solr特点三: QueryElevation(编辑结果排序)
在理想的情况下,搜索引擎只返回与用户查询相关的文档.而在现实的查询中,编辑(没发现更合适的表达)通常需要指定特定文档在搜索结果中的特定位置.这样做有很多原因.或许 “置顶” 的文档就是最好的查询结果. ...
solr特点三: defType(查询权重排序)
Solr的defType有dismax/edismax两种,这两种的区别,可参见:http://blog.csdn.net/duck_genuine/article/details/8060026 e ...
Solr系列三：solr索引详解（Schema介绍、字段定义详解、Schema API 介绍）
一.Schema介绍 1. Schema 是什么? Schema:模式,是集合/内核中字段的定义,让solr知道集合/内核包含哪些字段.字段的数据类型.字段该索引存储. 2. Schema 的定义方式 ...
pytest+allure(allure-pytest基于这个插件)设计定制化报告
一:环境准备 1.python3.6 2.windows环境 3.pycharm 4.allure-pytest 5.allure2.8.0 6.java1.8 allure-pytest快速安装在 ...
pytest+allure(pytest-allure-adaptor基于这个插件)设计定制化报告
一:环境准备 1.python3.6 2.windows环境 3.pycharm 4.pytest-allure-adaptor 5.allure2.8.0 6.java1.8 pytest-allu ...
Yoshino: 一个基于React的可定制化的PC组件库
Github: https://github.com/Yoshino-UI... Docs: https://yoshino-ui.github.io/#/ Cli-Tool: https://git ...
ERP_基于Oracle ADF的定制化企业级IT系统解决方案
2014-12-31 Created By BaoXinjian
Solr学习笔记(1) —— Solr概述&Solr的安装
一.概述使用Solr实现电商网站中商品信息搜索功能,可以根据关键字.分类.价格搜索商品信息,也可以根据价格进行排序. 1.1 实现方法在一些大型门户网站.电子商务网站等都需要站内搜索功能,使用传统 ...

随机推荐

[LigerUI]使用记录
1. 下拉框设定鼠标移开隐藏但想改变下拉框大小时很难一次定位到下拉框右下角那个点 2. ligerTab 自带标题菜单但想修改成类似于 chrome 的标题菜单时貌似没有找到方法我用 ea ...
aix操作系统的版本中TL SP 含义
AIX 分为四个主要的操作系统级别:版本.发行版.技术级 (TL) 和服务包 (SP).版本和发行版通常指的是 AIX 的名称,例如AIX 7.1.TL 是包含重大更新的操作系统的发行版,而 SP 包 ...
利用iWARP/RDMA解决以太网高延迟
导读:“iWARP能够带来超低延迟.”据介绍,RDMA,即远程直接内存访问提供了应用程序到应用程序的直接通信能力,这也就意味着,应用将跳过操作系统,实现远程内存应用程序的访问关键词: iWARP 低 ...
C# 子窗体关闭父窗体的简单方法
当在一个窗体中调用另一个窗体时,涉及到子窗体关闭的同时,父窗体同时关闭. 例如: 在窗体1中,单击按钮调用窗体2,通过this传递 private void button1_Click(object ...
Spring Boot自动配置
Spring Boot自动配置原理 Spring Boot的自动配置注解是@EnableAutoConfiguration, 从上面的@Import的类可以找到下面自动加载自动配置的映射. org.s ...
迷你MVVM框架 avalonjs 学习教程2、模块化、ViewModel、作用域
一个项目是由许多人分工写的,因此必须要合理地拆散,于是有了模块化.体现在工作上,PM通常它这为某某版块,某某频道,某某页面.某一个模块,必须是包含其固有的数据,样式,HTML与处理逻辑.在jQuery ...
filebeat 笔记
认识Beats Beats是用于单用途数据托运人的平台.它们以轻量级代理的形式安装,并将来自成百上千台机器的数据发送到Logstash或Elasticsearch. (画外音:通俗地理解,就是采集数据 ...
mybatis框架入门程序：演示通过mybatis实现数据库的添加操作
1.mybatis的基本配置准备在我的这篇博文中可以找到:https://www.cnblogs.com/wyhluckdog/p/10149480.html 2. 映射文件: 在User.xml中添 ...
Linux 启动和关闭自定义命令
首先是启动命令 [lambert@lambert ~]$ vim startup.sh #!/bin/bash nohup XXXXXX >/home/lambert/>& &am ...
Win10正式版怎么关闭windows defender
分步阅读如何关闭Win10正式版系统所自带的"Windows Defender"程序呢?"Windows Defender"程序是Win10正式版系统所自带的 ...

solr特点三: 基于Solr实现排序定制化参考

solr特点三: 基于Solr实现排序定制化参考的更多相关文章

随机推荐

热门专题