solr中facet及facet.pivot理解（整合两篇文章保留参考）

Facet['fæsɪt]很难翻译，只能靠例子来理解了。Solr作者Yonik Seeley也给出更为直接的名字：导航（Guided Navigation）、参数化查询（Paramatic Search）。

上面是比较直接的Faceted Search例子，品牌、产品特征、卖家，均是 Facet 。而Apple、Lenovo等品牌，就是 Facet values 或者说 Constraints ，而Facet values所带的统计值就是 Facet count/Constraint count 。

2 、Facet 使用

q = 超级本
facet = true
facet.field = 产品特性
facet.field = 品牌
facet.field = 卖家

http://…/select?q=超级本&facet=true&wt=json

&facet.field=品牌&facet.field=产品特性&facet.field=卖家

也可以提交查询条件，设置fq(filter query)。

q = 电脑
facet = true
fq = 价格:[8000 TO *]
facet.mincount = 1 // fq将不符合的字段过滤后，会显示count为0
facet.field = 产品特性
facet.field = 品牌
facet.field = 卖家

http://…/select?q=超级本&facet=true&wt=json

&fq=价格:[8000 TO *]&facet.mincount=1

&facet.field=品牌&facet.field=产品特性&facet.field=卖家

"facet_counts": {

"facet_fields": {

  "品牌": [

    "Apple", 4,

    "Lenovo", 39

      …]

  "产品特性": [

    "显卡", 42,

    "酷睿", 38

      …]

  …}}

如果用户选择了Apple这个分类，查询条件中需要添加另外一个fq查询条件，并移除Apple所在的facet.field。

http://…/select?q=超级本&facet=true&wt=json

&fq=价格:[8000 TO *]&fq=品牌:Apple&facet.mincount=1

~~&facet.field= 品牌~~ &facet.field=产品特性&facet.field=卖家

3 、Facet 参数

facet.prefix – 限制constaints的前缀

facet.mincount=0 – 限制constants count的最小返回值，默认为0

facet.sort=count – 排序的方式，根据count或者index

facet.offset=0 – 表示在当前排序情况下的偏移，可以做分页

facet.limit=100 – constraints返回的数目

facet.missing=false – 是否返回没有值的field

facet.date – Deprecated, use facet.range

facet.query

指定一个查询字符串作为Facet Constraint

facet.query = rank:[* TO 20]

facet.query = rank:[21 TO *]

"facet_counts": {

"facet_fields": {

  "品牌": [

    "Apple", 4,

    "Lenovo", 10

      …]

  "产品特性": [

    "显卡", 11,

    "酷睿", 20

      …]

  …}}

facet.range

http://…/select?&facet=true

&facet.range=price

&facet.range.start=5000

&facet.range.end=8000

&facet.range.gap=1000

<result numFound="27" ... />

 ...

 <lst name="facet_counts">

 <lst name="facet_queries">

   <int name="rank:[* TO 20]">2</int>

   <int name="rank:[21 TO *]">15</int>

 </lst>

...

WARNING: range范围是左闭右开，[start, end)

facet.pivot

这个是Solr 4.0的新特性，pivot和facet一样难理解，还是用例子来讲吧。

Syntax: facet.pivot=field1,field2,field3...

e.g. facet.pivot=comment_user, grade

#docs	#docs grade:好	#docs 等级:中	#docs 等级:差
comment_user:1	10	8	1	1
comment_user:2	20	18	2	0
comment_user:3	15	12	2	1
comment_user:4	18	15	2	1

"facet_counts":{

"facet_pivot":{

 "comment_user, grade ":[{

   "field":"comment_user",

   "value":"1",

   "count":10,

   "pivot":[{

     "field":"grade",

     "value":"好",

     "count":8}, {

     "field":"grade",

     "value":"中",

     "count":1}, {

     "field":"grade",

     "value":"差",

     "count":1}]

   }, {

     "field":" comment_user ",

     "value":"2",

     "count":20,

     "pivot":[{

      …

没有pivot机制的话，要做到上面那点可能需要多次查询：

http://...q= comment&fq= grade:好&facet=true&facet.field=comment_user

http://...q=comment&fq=grade:中&facet=true&facet.field=comment_user

http://...q=comment&fq=grade:差&facet=true&facet.field=comment_user

Facet.pivot - Computes a Matrix of Constraint Counts across multiple Facet Fields. by Yonik Seeley.

上面那个解释很不错，只能理解不能翻译。

facet.pivot自己的理解，就是按照多个维度进行分组查询，以下是自己的实战代码，按照newsType，property两个维度统计：

public List<ReportNewsTypeDTO> queryNewsType(

            ReportQuery reportQuery) {

        HttpSolrServer solrServer = SolrServer.getInstance().getServer();

        SolrQuery sQuery = new SolrQuery();

        List<ReportNewsTypeDTO> list = new ArrayList<ReportNewsTypeDTO>();

        try {

            String para = this.initReportQueryPara(reportQuery, 0);

            sQuery.setFacet(true);

            sQuery.add("facet.pivot", "newsType,property");//根据这两维度来分组查询

            sQuery.setQuery(para);

            QueryResponse response = solrServer.query(sQuery,SolrRequest.METHOD.POST);

            NamedList<List<PivotField>> namedList = response.getFacetPivot();

            System.out.println(namedList);//底下为啥要这样判断，把这个值打印出来，你就明白了

            if(namedList != null){

                List<PivotField> pivotList = null;

                for(int i=0;i<namedList.size();i++){

                    pivotList = namedList.getVal(i);

                    if(pivotList != null){

                        ReportNewsTypeDTO dto = null;

                        for(PivotField pivot:pivotList){

                            dto = new ReportNewsTypeDTO();

                            dto.setNewsTypeId((Integer)pivot.getValue());

                            dto.setNewsTypeName(News.newsTypeMap.get((Integer)pivot.getValue()));

                            int pos = 0;

                            int neg = 0;

                            List<PivotField> fieldList = pivot.getPivot();

                            if(fieldList != null){

                                for(PivotField field:fieldList){

                                    int proValue = (Integer) field.getValue();

                                    int count = field.getCount();

                                    if(proValue == 1){

                                        pos = count;

                                    }else{

                                        neg = count;

                                    }

                                }

                            }

                            dto.setPositiveCount(pos);

                            dto.setNegativeCount(neg);

                            list.add(dto);

                        }

                    }

                }

            }

            return list;

        } catch (SolrServerException e) {

            log.error("查询solr失败", e);

            e.printStackTrace();

        } finally{

            solrServer.shutdown();

            solrServer = null;

        }

        return list;

    }

namedList打印结果:

{newsType,property=

[

newsType:8 [4260] [property:1 [3698] null, property:0 [562] null],

newsType:1 [1507] [property:1 [1389] null, property:0 [118] null],

newsType:2 [1054] [property:1 [909] null, property:0 [145] null],

newsType:6 [715] [property:1 [581] null, property:0 [134] null],

newsType:4 [675] [property:1 [466] null, property:0 [209] null],

newsType:3 [486] [property:1 [397] null, property:0 [89] null],

newsType:7 [458] [property:1 [395] null, property:0 [63] null],

newsType:5 [289] [property:1 [263] null, property:0 [26] null],

newsType:9 [143] [property:1 [138] null, property:0 [5] null]

]

}

这下应该明白了。写到这里，突然想到一个，所有的分组查询统计，不管是一个维度两个维度都可以使用face.pivot来统计，不错的东东。

solr中facet及facet.pivot理解（整合两篇文章保留参考）的更多相关文章

本版本延续MVC中的统一验证机制~续的这篇文章，本篇主要是对验证基类的扩展和改善(转)
本版本延续MVC中的统一验证机制~续的这篇文章,本篇主要是对验证基类的扩展和改善 namespace Web.Mvc.Extensions { #region 验证基类 /// <summary ...
mysql中的中文乱码解决方案, 全部是这篇文章的内容: https://www.52jbj.com/jbdq/18755.html
我们自己鼓捣mysql时,总免不了会遇到这个问题:插入中文字符出现乱码,虽然这是运维先给配好的环境,但是在自己机子上玩的时候咧,总得知道个一二吧,不然以后如何优雅的吹牛B. 如果你也遇到了这个问题,咱 ...
Java反射机制的浅显理解（这篇文章还没写好，留个草稿给自己看的）
目前只是有一个大概的理解,先把自己感觉容易立即的概念放这里,等以后结合实际工作理解深刻了再来补充. 一.什么是Java反射机制?(多种定义) 1. JAVA反射机制是在运行状态中,对于任意一个类,都能 ...
CSS中如果实现元素浮动，看这篇文章就足够了
浮动基本介绍在标准文档流中元素分为2种,块级元素和行内元素,如果想让一些元素既要有块级元素的特点也同时保留行内元素特点,只能让这些元素脱离标准文档流即可. 浮动可以让元素脱离标准文档流,可以实现让多 ...
关于super的理解，三篇文章支撑起来的
1.有向图的拓扑排序https://blog.csdn.net/wp1603710463/article/details/50900892 2. Python中MRO算法 http://mp.weix ...
阅读了这三篇文章，你也就基本理解了ASP.NET Core MVC框架的工作原理
<200行代码,7个对象--让你了解ASP.NET Core框架的本质>让很多读者对ASP.NET Core管道有深刻的理解,知道了ASP.NET Core框架针对每个请求的处理流程.在过 ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（六）easyUI与富文本编辑器UEditor整合
日常啰嗦本来这一篇和接下来的几篇是打算讲一下JDBC和数据库优化的,但是最近很多朋友加我好友也讨论了一些问题,我发现大家似乎都是拿这个项目作为练手项目,作为脚手架来用的,因此呢,改变了一下思路,JD ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（七）图片上传功能
日常啰嗦前一篇文章<Spring+SpringMVC+MyBatis+easyUI整合优化篇(六)easyUI与富文本编辑器UEditor整合>讲了富文本编辑器UEditor的整合与使用 ...
Spring+SpringMVC+MyBatis+easyUI整合优化篇（八）代码优化整理小记及个人吐槽
日常啰嗦这两天也一直在纠结这一篇文章该写什么东西,前面临时加的两篇文章就有些打乱了整体节奏,这一篇又想去写一下代码层面优化的事情,可是也不太能抓住重要的点,不太确定从何入手,因为这件事情牵涉了太多技 ...

随机推荐

关于mysql设置外键，实现参照性完整性约束，以及workbench上的一个bug（？）
一.本次数据库中有student,course,sc表,其设置情况 -- 创建course表 CREATE TABLE `course` ( `cno` ) NOT NULL, `cname` ) D ...
kylin cubing algorithm（算法）
看到这一块的视频,结合光方博客的一些文档及自己的一点理解,记个笔记,以备不时之需. by layer cubing 1.on MR 这个算法的对cube的计算就像它的名字一样是按player进行的. ...
寒假作业 pta编程总结3
实验代码: 某地老鼠成灾,现悬赏抓老鼠,每抓到一只奖励10元,于是开始跟老鼠斗智斗勇:每天在墙角可选择以下三个操作:放置一个带有一块奶酪的捕鼠夹(T),或者放置一块奶酪(C),或者什么也不放(X).捕 ...
Linux安装中文字体_宋体
E&T: CentOS_7.4 64位; mswfonts.tar.xz; Xftp5; Xshell5; 最近在完成合同电子签署时,合同的中文参数在服务器出现中文乱码问题, 编码一致且正确, ...
用vs2010打开使用vs2013升级后的WP工程
项目在win7+vs2010的环境中建立的,后来在win8.1+vs2013的环境下修改和完善: 但是所有功能实现后发现wp7项目在使用vs2013打开后因为单向升级的原因,项目只能被编译为wp8项目 ...
re正则匹配城市名
匹配城市名称,只要第一次出现之后的数据 import re a='巴州区白云县台公交乡公司对面区海蜃楼6楼' b=re.search(r'(^\w+?区)|(^\w+?县)|(^\w+?镇)',a). ...
jmeter的简单http接口用法
1. jmeter的启动:windows下的环境进入jmeter的并目录双击启动 Mac电脑进入bin目录找到jmeter.sh 文件在终端执行./jmeter.sh 或者./jmeter. ...
saltstack实战1-salt-syndic
Syndic建立在中心Master和Minions之间, 并允许多层分级Syndic, 使Salt拓扑可以变得更为灵活. 那么Syndic是如何工作的? 当前有哪些优势和局限哪? Syndic的优势和 ...
Elasticsearch（单节点）
1 Elasticsearch搭建 1.1 通过Wget下载ElasticSearch安装包wget https://artifacts.elastic.co/downloads/elasticsea ...
linux系统服务详解
下面现介绍一下运行次序和运行级别: 一个 Linux 系统的引导过程可以分为几个阶段.我们主要看看当内核加载后的那一个阶段.你可以运行runlevel 命令来确定您的系统当前的运行级,当内核被加载并开 ...

solr中facet及facet.pivot理解（整合两篇文章保留参考）

solr中facet及facet.pivot理解（整合两篇文章保留参考）的更多相关文章

随机推荐

热门专题