solr中facet及facet.pivot理解（整合两篇文章保留参考）

Facet['fæsɪt]很难翻译，只能靠例子来理解了。Solr作者Yonik Seeley也给出更为直接的名字：导航（Guided Navigation）、参数化查询（Paramatic Search）。

上面是比较直接的Faceted Search例子，品牌、产品特征、卖家，均是 Facet 。而Apple、Lenovo等品牌，就是 Facet values 或者说 Constraints ，而Facet values所带的统计值就是 Facet count/Constraint count 。

2 、Facet 使用

q = 超级本
facet = true
facet.field = 产品特性
facet.field = 品牌
facet.field = 卖家

http://…/select?q=超级本&facet=true&wt=json

&facet.field=品牌&facet.field=产品特性&facet.field=卖家

也可以提交查询条件，设置fq(filter query)。

q = 电脑
facet = true
fq = 价格:[8000 TO *]
facet.mincount = 1 // fq将不符合的字段过滤后，会显示count为0
facet.field = 产品特性
facet.field = 品牌
facet.field = 卖家

http://…/select?q=超级本&facet=true&wt=json

&fq=价格:[8000 TO *]&facet.mincount=1

&facet.field=品牌&facet.field=产品特性&facet.field=卖家

"facet_counts": {

"facet_fields": {

  "品牌": [

    "Apple", 4,

    "Lenovo", 39

      …]

  "产品特性": [

    "显卡", 42,

    "酷睿", 38

      …]

  …}}

如果用户选择了Apple这个分类，查询条件中需要添加另外一个fq查询条件，并移除Apple所在的facet.field。

http://…/select?q=超级本&facet=true&wt=json

&fq=价格:[8000 TO *]&fq=品牌:Apple&facet.mincount=1

~~&facet.field= 品牌~~ &facet.field=产品特性&facet.field=卖家

3 、Facet 参数

facet.prefix – 限制constaints的前缀

facet.mincount=0 – 限制constants count的最小返回值，默认为0

facet.sort=count – 排序的方式，根据count或者index

facet.offset=0 – 表示在当前排序情况下的偏移，可以做分页

facet.limit=100 – constraints返回的数目

facet.missing=false – 是否返回没有值的field

facet.date – Deprecated, use facet.range

facet.query

指定一个查询字符串作为Facet Constraint

facet.query = rank:[* TO 20]

facet.query = rank:[21 TO *]

"facet_counts": {

"facet_fields": {

  "品牌": [

    "Apple", 4,

    "Lenovo", 10

      …]

  "产品特性": [

    "显卡", 11,

    "酷睿", 20

      …]

  …}}

facet.range

http://…/select?&facet=true

&facet.range=price

&facet.range.start=5000

&facet.range.end=8000

&facet.range.gap=1000

<result numFound="27" ... />

 ...

 <lst name="facet_counts">

 <lst name="facet_queries">

   <int name="rank:[* TO 20]">2</int>

   <int name="rank:[21 TO *]">15</int>

 </lst>

...

WARNING: range范围是左闭右开，[start, end)

facet.pivot

这个是Solr 4.0的新特性，pivot和facet一样难理解，还是用例子来讲吧。

Syntax: facet.pivot=field1,field2,field3...

e.g. facet.pivot=comment_user, grade

#docs	#docs grade:好	#docs 等级:中	#docs 等级:差
comment_user:1	10	8	1	1
comment_user:2	20	18	2	0
comment_user:3	15	12	2	1
comment_user:4	18	15	2	1

"facet_counts":{

"facet_pivot":{

 "comment_user, grade ":[{

   "field":"comment_user",

   "value":"1",

   "count":10,

   "pivot":[{

     "field":"grade",

     "value":"好",

     "count":8}, {

     "field":"grade",

     "value":"中",

     "count":1}, {

     "field":"grade",

     "value":"差",

     "count":1}]

   }, {

     "field":" comment_user ",

     "value":"2",

     "count":20,

     "pivot":[{

      …

没有pivot机制的话，要做到上面那点可能需要多次查询：

http://...q= comment&fq= grade:好&facet=true&facet.field=comment_user

http://...q=comment&fq=grade:中&facet=true&facet.field=comment_user

http://...q=comment&fq=grade:差&facet=true&facet.field=comment_user

Facet.pivot - Computes a Matrix of Constraint Counts across multiple Facet Fields. by Yonik Seeley.

上面那个解释很不错，只能理解不能翻译。

facet.pivot自己的理解，就是按照多个维度进行分组查询，以下是自己的实战代码，按照newsType，property两个维度统计：

public List<ReportNewsTypeDTO> queryNewsType(

            ReportQuery reportQuery) {

        HttpSolrServer solrServer = SolrServer.getInstance().getServer();

        SolrQuery sQuery = new SolrQuery();

        List<ReportNewsTypeDTO> list = new ArrayList<ReportNewsTypeDTO>();

        try {

            String para = this.initReportQueryPara(reportQuery, 0);

            sQuery.setFacet(true);

            sQuery.add("facet.pivot", "newsType,property");//根据这两维度来分组查询

            sQuery.setQuery(para);

            QueryResponse response = solrServer.query(sQuery,SolrRequest.METHOD.POST);

            NamedList<List<PivotField>> namedList = response.getFacetPivot();

            System.out.println(namedList);//底下为啥要这样判断，把这个值打印出来，你就明白了

            if(namedList != null){

                List<PivotField> pivotList = null;

                for(int i=0;i<namedList.size();i++){

                    pivotList = namedList.getVal(i);

                    if(pivotList != null){

                        ReportNewsTypeDTO dto = null;

                        for(PivotField pivot:pivotList){

                            dto = new ReportNewsTypeDTO();

                            dto.setNewsTypeId((Integer)pivot.getValue());

                            dto.setNewsTypeName(News.newsTypeMap.get((Integer)pivot.getValue()));

                            int pos = 0;

                            int neg = 0;

                            List<PivotField> fieldList = pivot.getPivot();

                            if(fieldList != null){

                                for(PivotField field:fieldList){

                                    int proValue = (Integer) field.getValue();

                                    int count = field.getCount();

                                    if(proValue == 1){

                                        pos = count;

                                    }else{

                                        neg = count;

                                    }

                                }

                            }

                            dto.setPositiveCount(pos);

                            dto.setNegativeCount(neg);

                            list.add(dto);

                        }

                    }

                }

            }

            return list;

        } catch (SolrServerException e) {

            log.error("查询solr失败", e);

            e.printStackTrace();

        } finally{

            solrServer.shutdown();

            solrServer = null;

        }

        return list;

    }

namedList打印结果:

{newsType,property=

[

newsType:8 [4260] [property:1 [3698] null, property:0 [562] null],

newsType:1 [1507] [property:1 [1389] null, property:0 [118] null],

newsType:2 [1054] [property:1 [909] null, property:0 [145] null],

newsType:6 [715] [property:1 [581] null, property:0 [134] null],

newsType:4 [675] [property:1 [466] null, property:0 [209] null],

newsType:3 [486] [property:1 [397] null, property:0 [89] null],

newsType:7 [458] [property:1 [395] null, property:0 [63] null],

newsType:5 [289] [property:1 [263] null, property:0 [26] null],

newsType:9 [143] [property:1 [138] null, property:0 [5] null]

]

}

这下应该明白了。写到这里，突然想到一个，所有的分组查询统计，不管是一个维度两个维度都可以使用face.pivot来统计，不错的东东。

solr中facet及facet.pivot理解（整合两篇文章保留参考）的更多相关文章

本版本延续MVC中的统一验证机制~续的这篇文章，本篇主要是对验证基类的扩展和改善(转)
本版本延续MVC中的统一验证机制~续的这篇文章,本篇主要是对验证基类的扩展和改善 namespace Web.Mvc.Extensions { #region 验证基类 /// <summary ...
mysql中的中文乱码解决方案, 全部是这篇文章的内容: https://www.52jbj.com/jbdq/18755.html
我们自己鼓捣mysql时,总免不了会遇到这个问题:插入中文字符出现乱码,虽然这是运维先给配好的环境,但是在自己机子上玩的时候咧,总得知道个一二吧,不然以后如何优雅的吹牛B. 如果你也遇到了这个问题,咱 ...
Java反射机制的浅显理解（这篇文章还没写好，留个草稿给自己看的）
目前只是有一个大概的理解,先把自己感觉容易立即的概念放这里,等以后结合实际工作理解深刻了再来补充. 一.什么是Java反射机制?(多种定义) 1. JAVA反射机制是在运行状态中,对于任意一个类,都能 ...
CSS中如果实现元素浮动，看这篇文章就足够了
浮动基本介绍在标准文档流中元素分为2种,块级元素和行内元素,如果想让一些元素既要有块级元素的特点也同时保留行内元素特点,只能让这些元素脱离标准文档流即可. 浮动可以让元素脱离标准文档流,可以实现让多 ...
关于super的理解，三篇文章支撑起来的
1.有向图的拓扑排序https://blog.csdn.net/wp1603710463/article/details/50900892 2. Python中MRO算法 http://mp.weix ...
阅读了这三篇文章，你也就基本理解了ASP.NET Core MVC框架的工作原理
<200行代码,7个对象--让你了解ASP.NET Core框架的本质>让很多读者对ASP.NET Core管道有深刻的理解,知道了ASP.NET Core框架针对每个请求的处理流程.在过 ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（六）easyUI与富文本编辑器UEditor整合
日常啰嗦本来这一篇和接下来的几篇是打算讲一下JDBC和数据库优化的,但是最近很多朋友加我好友也讨论了一些问题,我发现大家似乎都是拿这个项目作为练手项目,作为脚手架来用的,因此呢,改变了一下思路,JD ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（七）图片上传功能
日常啰嗦前一篇文章<Spring+SpringMVC+MyBatis+easyUI整合优化篇(六)easyUI与富文本编辑器UEditor整合>讲了富文本编辑器UEditor的整合与使用 ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（八）代码优化整理小记及个人吐槽
日常啰嗦这两天也一直在纠结这一篇文章该写什么东西,前面临时加的两篇文章就有些打乱了整体节奏,这一篇又想去写一下代码层面优化的事情,可是也不太能抓住重要的点,不太确定从何入手,因为这件事情牵涉了太多技 ...

随机推荐

JPA Example 基本使用使用实例
一.相关接口方法在继承JpaRepository接口后,自动拥有了按“实例”进行查询的诸多方法.这些方法主要在两个接口中定义,一是QueryByExampleExecutor,一个是JpaR ...
[ 随手记 5 ] C/C++ 继承
个人理解: 继承:(意译)继续承接: A继承B,则A是派生类/子类,B为基类/父类: B有的成员变量/性质,A全部都有,而A有的B不一定有,在数学集合上可以说:B是A的子集: A继承B,可以说是A在B ...
MTLD -词汇复杂度的指标
论文: MTLD, vocd-D, and HD-D: A validation study of sophisticated approaches to lexical diversity asse ...
install MariaDB 10.2 on Ubuntu 18
Here are the commands to run to install MariaDB 10.2 from the MariaDB repository on your Ubuntu syst ...
unity 常用插件 2
Advanced PlayerPrefs Window 用来管理 PlayerPrefs 数据,超好用 JsonDotNet JSON 的序列化/反序列化插件.这个插件是支持 iOS, Android ...
Java成神路上之设计模式系列教程之一
Java成神路上之设计模式系列教程之一千锋-Feri 在Java工程师的日常中,是否遇到过如下问题: Java 中什么叫单例设计模式?请用Java 写出线程安全的单例模式? 什么是设计模式?你是否在 ...
loj#2720. 「NOI2018」你的名字
链接大合集: loj uoj luogu bzoj 单纯地纪念一下写的第一份5K代码.../躺尸因为ZJOI都不会所以只好写NOI的题了... 总之字符串题肯定一上来就拼个大字符串跑后缀数组啦! ( ...
javascript 操作节点的属性
使用层次关系访问节点 parentNode:返回节点的父节点 childNodes:返回子节点集合,childNodes[i] firstChild:返回节点的第一个子节点,最普遍的用法是访问该元素的 ...
TensorFlow：检查显卡支持哪个版本的CUDA
最近想学习TensorFlow深度学习编程,然后就开始查这方面的信息. 第0步是安装环境,配置环境. 首先到TensorFlow的官网查看在Windows上安装的条件和步骤. 可以仅仅安装CPU版本的 ...
day62 中间件
一.中间件的介绍中间件顾名思义,是介于request与response处理之间的一道处理过程,相对比较轻量级, 并且在全局上改变django的输入与输出.因为改变的是全局,所以需要谨慎实用, 用不好 ...

solr中facet及facet.pivot理解（整合两篇文章保留参考）

solr中facet及facet.pivot理解（整合两篇文章保留参考）的更多相关文章

随机推荐

热门专题