8.3Solr API使用(StatsComponent聚合统计)

转载请出自出处：http://eksliang.iteye.com/blog/2169134

一、概述

Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能

二、参数

参数	含义
stats	是否开启stats（true/false）
stats.field	添加一个字段来统计，可以有多个
stats.facet	在给定的面返回值的子结果。

三、参考实例

参考实例一：查询参数

q=*:*

&stats=true

&stats.field=price

&stats.field=popularity

&rows=0

返回结果如下：

<lst name="stats">

 <lst name="stats_fields">

  <lst name="price">

    <double name="min">0.0</double>        --最小值

    <double name="max">2199.0</double>     --最大值

    <double name="sum">5251.2699999999995</double> --总和

    <long name="count">15</long>                   --记录数，也就是多少行记录

    <long name="missing">11</long>                 --结果集中，有多少条记录是空值

    <double name="sumOfSquares">6038619.160300001</double> --平方和（x1^2 + x2^2+xn^2）

    <double name="mean">350.08466666666664</double>        --平均数（x1+x2+xn）/n

    <double name="stddev">547.737557906113</double>        --标准差

  </lst>

  <lst name="popularity">

    <double name="min">0.0</double>

    <double name="max">10.0</double>

    <double name="sum">90.0</double>

    <long name="count">26</long>

    <long name="missing">0</long>

    <double name="sumOfSquares">628.0</double>

    <double name="mean">3.4615384615384617</double>

    <double name="stddev">3.5578731762756157</double>

  </lst>

 </lst>

</lst>

参数含义如下：

返回字段	字段含义
min	最小值
max	最大值
sum	总和
count	记录数，也就是多少行记录
missing	结果集中，有多少条记录是空值
sumOfSquares	平方和（x1^2 + x2^2+xn^2）
mean	平均数（x1+x2+xn）/n
stddev	标准差

参考实例二：查询参数如下

q=*:*

&stats=true

&stats.field=price

&stats.field=popularity

&stats.facet=inStock

&rows=0

返回结果如下所示：

<lst name="stats">

 <lst name="stats_fields">

  <lst name="price">

  <double name="min">0.0</double>

  <double name="max">2199.0</double>

  <double name="sum">5251.2699999999995</double>

  <long name="count">15</long>

  <long name="missing">11</long>

  <double name="sumOfSquares">6038619.160300001</double>

  <double name="mean">350.08466666666664</double>

  <double name="stddev">547.737557906113</double>

  <lst name="facets">

   <lst name="inStock">

    <lst name="false">  --统计的是：在返回结果中inStock等于false部分,price的统计

      <double name="min">11.5</double>   --在inStock等于false的记录中pirce的最小值

      <double name="max">649.99</double> --在inStock等于false的记录中pirce的最大值

      <double name="sum">1161.39</double>--在inStock等于false的记录中pirce的总和

      <long name="count">4</long>        --inStock等于false的记录数

      <long name="missing">0</long>      --在inStock等于false的记录中pirce等于空的记录

      <double name="sumOfSquares">653369.2551</double>--在inStock等于false的记录中pirce的平方和

      <double name="mean">290.3475</double>--在inStock等于false的记录中pirce的平均值

      <double name="stddev">324.63444676281654</double>--在inStock等于false的记录中pirce的标准差

    </lst>

    <lst name="true">

      <double name="min">0.0</double>

      <double name="max">2199.0</double>

      <double name="sum">4089.879999999999</double>

      <long name="count">11</long>

      <long name="missing">0</long>

      <double name="sumOfSquares">5385249.905200001</double>

      <double name="mean">371.8072727272727</double>

      <double name="stddev">621.6592938755265</double>

    </lst>

   </lst>

  </lst>

 </lst>

</lst>

温馨提示：如果统计的列不是数字类型。而是字符串，那么统计的结果中只有如下列

参考实例如下：查询参数

q=*:*

&stats=true

&stats.field=CAR_NUM

&rows=0

返回结果如下所示：

<lst name="stats">

  <lst name="stats_fields">

    <lst name="CAR_NUM">

        <str name="min">08449</str>

        <str name="max">黑ZZ6T8警</str>

        <long name="count">9999999</long>

        <long name="missing">0</long>

        <lst name="facets"/>

    </lst>

   </lst>

</lst>

官方API地址：http://wiki.apache.org/solr/StatsComponent

8.3Solr API使用(StatsComponent聚合统计)的更多相关文章

关于MongoDB时间格式转换和时间段聚合统计的用法总结
一 . 背景需求在日常的业务需求中,我们往往会根据时间段来统计数据.例如,统计每小时的下单量:每天的库存变化,这类信息数据对运营管理很重要. 这类数据统计依赖于各个时间维度,年月日.时分秒都有可能. ...
Solr.NET快速入门(五)【聚合统计,分组查询】
聚合统计属性说明 Min 最小值 Max 最大值 Sum 总和 Count 记录数,也就是多少行记录 Missing 结果集中,有多少条记录是空值 SumOfSquares 平方和(x1^2 + ...
MongoDB 中聚合统计计算--$SUM表达式
我们一般通过表达式$sum来计算总和.因为MongoDB的文档有数组字段,所以可以简单的将计算总和分成两种:1,统计符合条件的所有文档的某个字段的总和:2,统计每个文档的数组字段里面的各个数据值的和. ...
用logstash 作数据的聚合统计
用logstash 作数据的聚合统计以spark-streaming 处理消费数据,统计日志经spark sql存储在mysql中日志写入方式为append val wordsDataFrame ...
Elasticsearch 第六篇：聚合统计查询
h2.post_title { background-color: rgba(43, 102, 149, 1); color: rgba(255, 255, 255, 1); font-size: 1 ...
小试牛刀ElasticSearch大数据聚合统计
ElasticSearch相信有不少朋友都了解,即使没有了解过它那相信对ELK也有所认识E即是ElasticSearch.ElasticSearch最开始更多用于检索,作为一搜索的集群产品简单易用绝对 ...
pandas：聚合统计、数据分箱、分组可视化
1.聚合统计 1.1描述统计 #df.describe(),对数据的总体特征进行描述 df.groupby('team').describe() df.groupby('team').describe ...
百度地图API 重新生成点聚合的功能
百度点聚合用来解决加载大量点要素到地图上产生覆盖现象的问题,并提高性能. http://api.map.baidu.com/library/MarkerClusterer/1.2/docs/symbo ...
Elasticsearch--Aggregation详细总结（聚合统计）
Elasticsearch的Aggregation功能也异常强悍. Aggregation共分为三种:Metric Aggregations.Bucket Aggregations. Pipeline ...

随机推荐

Netty 高性能之道 - Recycler 对象池的复用
前言我们知道,Java 创建一个实例的消耗是不小的,如果没有使用栈上分配和 TLAB,那么就需要使用 CAS 在堆中创建对象.所以现在很多框架都使用对象池.Netty 也不例外,通过重用对象,能够避 ...
OAuth2.0的理解&基础
此文章是复制黏贴网上文章的,主要做自己备用着看(也加了自己的一点见解),喜欢的读者也可以看. OAuth是一个关于授权(authorization)的开放网络标准,在全世界得到广泛应用,目前的版本是2 ...
[转]SQL Server Reporting Services - Timeout Settings
本文转自:https://social.technet.microsoft.com/wiki/contents/articles/23508.sql-server-reporting-services ...
net 异步与同步
一.摘论为什么不是摘要呢?其实这个是我个人的想法,其实很多人在谈论异步与同步的时候都忽略了,同步异步不是软件的原理,其本身是计算机的原理及概念,这里就不过多的阐述计算机原理了.在学习同步与异步之前, ...
Groovy中枚举简单使用--一对一映射
enum LevelEnum { S(1), C(2), B(3), A(4), X(5) private int value LevelEnum( int value) { this.value = ...
mysql报错1105 -without an explicit primary key with pxc_strict_mode = ENFORCING or MASTER
mysql报错1105 -without an explicit primary key with pxc_strict_mode = ENFORCING or MASTER. 在本地正常,但是在服务 ...
Median（vector+二分）
Median Time Limit: 5 Seconds Memory Limit: 65536 KB The median of m numbers is after sorting them in ...
浙大月赛ZOJ Monthly, August 2014
Abs Problem Time Limit: 2 Seconds Memory Limit: 65536 KB Special Judge Alice and Bob is playing a ga ...
Apache 、SUN、ORACLE
Apache: 全称:Apache Software Foundation 解释:apache 软件基金会.是专门为支持开源软件项目而办的一个非盈利性组织.在它所支持的Apache项目与子项目中,所发 ...
使用Picasso将加载的图片变成圆形
http://blog.it985.com/14794.html,感谢该作者 Picasso的GITHUB地址:https://github.com/square/picasso. 怎么实现各种各样的 ...

8.3Solr API使用(StatsComponent聚合统计)

8.3Solr API使用(StatsComponent聚合统计)的更多相关文章

随机推荐

热门专题