Solr 中的 docValues=true

前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一定的磁盘空间带来的好处主要有两个: (1)节省内存 (2)对排序,分组和一些聚合操作时能够大大提升性能下面来详细介绍下DocValue的原理和使用场景 (一)什么是DocValues? DocValues其实是Lucene在构建索引时,会额外建立一个有序的基于document => field valu…

Solr中Schema.xml中文版

<?xml version="1.0" encoding="UTF-8" ?> <!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor license agreements. See the NOTICE file distributed with this work for additional information regardin…

在Solr中配置和使用ansj分词

在上一节[编译Ansj之Solr插件]中介绍如何编译ansj分词在solr(lucene)环境中使用的接口,本章将介绍如何在solr中使用ansj,其步骤主要包括:下载或者编译ansj和nlp-lang等jar包.在schema中配置相关类型.将ansj和nlp-lang等jar包配置到solr中.测试ansj分词效果. 一.下载或者编译ansj-seg和nlp-lang等jar包. 1.您可以到 http://maven.ansj.org/org/ansj/ansj_seg/ | http…

Solr中初学Demo

import java.util.Collection; import java.util.Date; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.impl.HttpSolrServer; import org.apache.solr.client.solrj.response.QueryResponse; import org.apache.solr.common.Solr…

Solr中Field常用属性

FieldType 实例:<fieldType name="text_ik" class="solr.TextField"></fieldType> name:就是FieldType的名称 class:指向了org.apache.slor.analysis对应的class名称,用这个来定义类型的行为 Field: 实例:<field name="content_ik" type="text_ik"…

Solr 08 - 在Solr Web管理页面中查询索引数据 (Solr中各类查询参数的使用方法)

目录 1 Solr管理页面的查询入口 2 Solr查询输入框简介 3 Solr管理页面的查询方案 1 Solr管理页面的查询入口选中需要查询的SolrCore, 然后在菜单栏选择[Query]: 2 Solr查询输入框简介 (1) select: 查询请求处理器. (2) q: 是query的简写, 指定查询表达式. *:* --表示查询所有, 比如: product_name:花儿朵朵, 表示"product_name"字段中包含"花儿朵朵". (3) fq:…

Solr 06 - Solr中配置使用IK分词器 (配置schema.xml)

目录 1 配置中文分词器 1.1 准备IK中文分词器 1.2 配置schema.xml文件 1.3 重启Tomcat并测试 2 配置业务域 2.1 准备商品数据 2.2 配置商品业务域 2.3 配置schema.xml文件 2.4 重新启动Tomcat并查看配置 1 配置中文分词器 1.1 准备IK中文分词器 (1) 复制IK解压目录中的jar包: IKAnalyzer2012FF_u1.jar. 可以在我的GitHub 中下载, 文件是IK Analyzer 2012FF_hf1.zip.…

Solr中的group与facet的区别

Solr中的group与facet的区别如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的. 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Exception { solrServer = createSolrServer(); SolrQueryquery = newSolrQuery();//建立一个新的查询 query.setQuery("jobsNa…

solr中Cache综述

一.概述 Solr查询的核心类就是SolrIndexSearcher,每个core通常在同一时刻只由当前的SolrIndexSearcher供上层的handler使用(当切换SolrIndexSearcher时可能会有两个同时提供服务),而Solr的各种Cache是依附于SolrIndexSearcher的,SolrIndexSearcher存在则Cache生,SolrIndexSearcher亡则Cache被清空close掉.Solr在Lucene之上开发了很多Cache功能,从目前提供的Ca…

如何将数据库中的数据导入到Solr中

要使用solr实现网站中商品搜索,需要将mysql数据库中数据在solr中创建索引. 1.需要在solr的schema.xml文件定义要存储的商品Field. 商品表中的字段为: 配置内容是:  <field name="product_name" type="text_ik" indexed="true" stored="true"/> <field name=&qu…

指尖上的电商---(8)Solr中Facet的使用方法

在大型电子商务站点中,在商品列表页,我们都能够看到商品按分类,品牌,价格的分类显示,例如以下图,这些我们能够使用solr中的facet功能实现. facet的基本功能就是对搜索结果中的商品进行分类. 1.facet使用方法 facet.field:指定要分类的字段 facet=on 或 facet=true表示功能开启 facet.prefix 表示字段前缀 facet.limit 表示返回的记录数 facet.offict 表示从第几条開始,主要用于分页 facet.query能够随意定义查询…

lucene、solr中的日期衰减方法-------function query --尚未测试在solr4.8

经常有一种情景是这样的:我们索引了N年的文章,而查询时候无论直接用相关度.或者用时间排序,都是比较鲁莽的:我们想要一种既要相关度比较高,又要时间上比较新的文章. 这时候的解决办法就是,自定义日期衰减的ValueSourceQuery,然后在正常normalQuery的基础上后遭CustomScoreQuery即可. 下面给出2种在solr中使用日期衰减的方法比如我们的索引中的时间字段是time,正常查询是title:哈哈 keyword:哈哈, 1.使用已有的各种functionQuery的组…

在Solr中配置中文分词IKAnalyzer

李克华云计算高级群: 292870151 交流:Hadoop.NoSQL.分布式.lucene.solr.nutch 在Solr中配置中文分词IKAnalyzer 1.在配置文件schema.xml(位置{SOLR_HOME}/config/下),配置信息如下:  <fieldType name="text_ik" class="solr.TextField"> <…

solr入门之多线程操作solr中索引字段的解决

涉及的问题: 建索引时有一个字段是该词语出现的次数,这个字段是放在solr里的而我用的是多线程来进行全量导入的,这里就涉及到了多线程问题多个线程操作同一个变量时怎样处理? 我是这样子做的 : 首先将变量本地话--分布式就放到大容器中,我这里只使用了一个map来存词和次数的关系映射变量本地化后就是多线程的攻克了--锁的设置-我不过在操作时加了一个锁来解决问题这样做后整体上应该能解决变量的问题了最后另一个线程顺序问题要解决下当最后一个提交索引时获取的索引不一定是正确的索引当两个…

Solr中的group与facet的区别 [转]

Solr中的group与facet的区别 facet 自己理解就是分组聚合用的, 如下说明 http://blog.csdn.net/a925907195/article/details/47257243 Solr中的group与facet的区别如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的. 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Excepti…

Solr 18 - 通过SolrJ局部更新Solr中的文档 (原子操作、非覆盖操作)

目录 1 需求分析 2 需求实现 2.1 pom.xml依赖 2.2 Java代码示例 3 补充说明 3.1 关于文档中_version_的取值说明 3.2 store=true/false的区别 1 需求分析 (1) 需求: 向Solr中的文档添加新的字段并赋值, 或者修改已有的字段, 对不修改的要保持原值, 也就是不能进行完全覆盖操作. (2) 前提: 添加的字段(field)要提前在schema.xml文件中定义, 否则Solr无法处理这些字段, 肯定会导致添加失败. 关于schema.x…

IOS中div contenteditable=true无法输入

在IOS中<div contenteditable="true"></div>中点击时可以弹出键盘但是无法输入.加一个样式-webkit-user-select:text就可以了.…

solr与.net系列课程(八)solr中重跑索引的注意事项

solr与.net系列课程(八)solr中重跑索引的注意事项我们如果在项目中使用solr,那肯定就是把数据库中的数据跑进solr服务器中,solr有两种操作一种是新建索引,一种是增量索引,这里我们来说一说新建索引的一下注意事项终止跑索引 http://192.168.0.9:8080/solr/collection1/dataimport?command=abort 开始索引 http://192.168.0.9:80…

c++中-1是true呢还是false呢

今天想看一下引用c++中的,然后看到网上有问c++中-1是true or false呢?用vc6.0是了一下,是true.vc6.0中应该是非0的都是true,0为false.java我也试了一下,if(1)这种语句编译都不能通过,java中if()里面只能放boolean类型的变量. #include <iostream> using namespace std; void changeFlag(bool &flag); int main() { bool flag = true;…

在Python中怎么表达True

在Python中怎么表达True 为False的几种情况 0为False,其他所有数值皆为True 空串("")为False,其他所有字符串皆为True 空list([])为False,其他所有list皆为True 空tuple(())为False,其他所有tuple皆为True 空dict({})为False,其他所有dcit皆为True 杜绝的几种写法 if i==0: if str==“”: if list == None: if set is None: if dict =…

solr中重跑索引

solr与.net系列课程(八)solr中重跑索引的注意事项 solr与.net系列课程(八)solr中重跑索引的注意事项我们如果在项目中使用solr,那肯定就是把数据库中的数据跑进solr服务器中,solr有两种操作一种是新建索引,一种是增量索引,这里我们来说一说新建索引的一下注意事项终止跑索引 http://192.168.0.9:8080/solr/collection1/dataimport?command=abort 开始索引 …

Solr中的q与fq参数的区别

转自:搜索系统5:Solr中的q与fq参数的区别在那儿 1.对结果排序有影响今天遇到一个问题,把相同的参数比如name:张三,放到q与fq,两者返回的结果完全不一样. 经过debug发现,原因是这两个参数是solr查询的不同阶段使用的,所以结果不一样. 如果用于q.那么,就会查所有name中包含"张三"的,然后order by score,这时就会按name的相似度来排序. 而如果用fq,q设置为*:*.那么solr会先order by score,而因为条件是*:*,所以所有文档的…

Solr中的日期/时间表示

摘要: Solr的日期字段(TrieDateField 和DateRangeField)可以对一个时间点以毫秒精度表示. 格式 Solr中的日期有很严格的格式限制: YYYY-MM-DDThh:mm:ssZ YYYY 表示年 MM 表示月份 DD 表示天 hh 表示小时,24小时制 mm 表示分钟 ss 表示秒钟 Z 代表时区是UTC 比如: 2017-01-22T17:33:18Z 时区不能换,只能是UTC 更精细的表示时间可以是:2017-01-22T17:33:18.333Z 查询由于S…

如何在Solr中实现多core查询

基于solr或者elasticsearch提供的多核,多索引,多shard等查询能力,一般都是由lucene提供的多索引查询的功能演化而来的,这个功能在单机版的lucene里面确实没有发挥多大的威力,但是确是solrclourd,elasticsearch分布式集群查询数据的基础,正是因为lucene提供了多索引归并查询已经合并排序功能,所以在给它加上http的能力,就能把lucene也做成一个分布式的查询框架,当然一个分布式搜索引擎,需要考虑的内容非常多,容错,副本,高可靠,等都是主要功能.…

在Lucene或Solr中实现高亮的策略

一:功能背景近期要做个高亮的搜索需求,曾经也搞过.所以没啥难度.仅仅只是原来用的是Lucene,如今要换成Solr而已,在Lucene4.x的时候,散仙在曾经的文章中也分析过怎样在搜索的时候实现高亮,主要有三种方式.详细内容,请參考散仙曾经的2篇文章: 第一:在Lucene4.3中实现高亮的方式 http://qindongliang.iteye.com/blog/1953409 第二:在Solr4.3中服务端高亮的方式 http://qindongliang.iteye.com/blog/2…

python中1 is True 的结果为False，is判断与==判断的区别

python中1 is True 的结果为False,而1 == True的结果为True. python中True的数值就是1,那为什么1 is True 的结果为False呢? 因为is判断和==判断是有区别的: - ==:比较的是value,也就是数值的比较: - is :比较的是内存地址,也就是两个对象是否是同一个对象: ---------------------------------------------------由于python是弱类型语言,因此在使用判断时涉及到此类问题定要认…

java中关于while(true)的理解

java中while(true)的理解: while(true)作为无限循环,经常在不知道循环次数的时候使用,并且需要在循环内使用break才会停止,且在run()方法中基本都会写while(true)的循环.例如: public class XXXThread implements Runnable { public void run(){ while(true) { if(...//判断条件) break; -- } } 上诉代码中run方法中就是线程要运行的代码,运行完毕以后,就不会再次运…