有关lucene的问题

1.异常：Lock obtain timed out: NativeFSLock

原因：没有及时关闭indexWriter或者indexReader，lucene进行读写的时候会在文件夹里面创建lock ，不关闭的话，lock一直存在，下次进行读写，就会出现该问题

解决方法：3.0以及3.0版本之前的，写入document之后，关闭indexWriter ，查询用到indexSearcher，查询结束之后需要关闭indexSearcher

3.0之后的，写入document之后，关闭indexWriter ，查询用到indexReader ，查询结束之后需要关闭indexReader

例：

private void closeIndexWriter(IndexWriter writer) {

        if (writer != null) {

            try {

                writer.close();

            } catch (IOException e) {

                e.printStackTrace();

            } finally {

                try {

                    if (IndexWriter.isLocked(writer.getDirectory())) {

                        try {

                            Thread.sleep(1000);

                        } catch (InterruptedException e) {

                            // TODO Auto-generated catch block

                            e.printStackTrace();

                        }

                        IndexWriter.unlock(writer.getDirectory());

                    }

                    writer = null;

                } catch (IOException e) {

                    // TODO Auto-generated catch block

                    e.printStackTrace();

                }

            }

        }

    }

该方法需要放在外面，不然有可能在别的方法体内执行不了而没有关闭indexWriter

2.异常情况：
org.apache.lucene.search.BooleanQuery$TooManyClauses: maxClauseCount is set to 1024
at org.apache.lucene.search.BooleanQuery.add(BooleanQuery.java:165)
at org.apache.lucene.search.BooleanQuery.add(BooleanQuery.java:156)
at org.apache.lucene.search.RangeQuery.rewrite(RangeQuery.java:106)

原因：BooleanQuery用一个变量存储搜索字句 clauses 是一个List类型，同时使用另外一个变量限制其长度为1024 ，超过该数量，就会出现该异常。

比如，如果索引文档中包括条件 car 和 cars，那么使用 ca* 搜索之前，将被扩展成 car or cars。（查询字句的数目增大了，尤其是数据量较大，数据相似度较高，搜索条件较短的情况下这个出现的概率更高），这个条件列表的长度默认被限制在1024。当超出了1024的时候，就从上面的代码中抛出了异常。

解决方法：(1)、使用RangeFilter替换部分查询RangeQuery，但是效率会有影响；

(2)、设置默认长度值，BooleanQuery.setMaxClauseCount()，设置成10000，或者取消这个限制，BooleanQuery.setMaxClauseCount(Integer.MAX_VALUE).

如果设置过大，有可能会出现out of memory 错误。

(3)、针对个别特殊的字段进行一些优化，比如时间字段保留到yyyyMMdd位，以避免后面时分位带来的搜索条件的扩大。

3.异常：java.lang.IllegalArgumentException: A SPI class of type org.apache.lucene.codecs
.Codec with name 'Lucene41' does not exist. You need to add the corresponding JA
R file supporting this SPI to your classpath.The current classpath supports the
following names: [Lucene40, Lucene3x, SimpleText, Appending]

原因:索引文件版本为lucene4.1 而打开索引的代码版本只支持lucene4.0以及以下的

4.索引删除不掉

可能原因:(1)删除之后没有提交indexWriter或者是关闭indexWriter.(2)用term指定的域删除，而那个域没有被索引，比如说id,把该域索引进去或者换索引过的域进行删除即可。

5.按照某些域排序，排序结果不正常

可能原因:(1)该域被分词了，导致排序出现不科学的结果。可以将该域不分词，查询的时候将关键字按空格切割，然后循环建立query

注意:可以按照评分，然后再按照自己选择的域排序。sort数组元素顺序表示排序选项优先级从高到低

6.异常：EOF错误

原因：用特殊字符查询会导致错误，比如() [] {} ^ : /

解决方法：传入参数查询之前进行替换。

name.replaceAll("\\/", " ").replaceAll("\\(", " ").replaceAll("\\)", " ").replaceAll("\\:", " ").replaceAll("\\^", " ").replaceAll("\\[", " ").replaceAll("\\]", " ").replaceAll("\\{", " ").replaceAll("\\}", " ")

有关lucene的问题的更多相关文章

lucene 基础知识点
部分知识点的梳理,参考<lucene实战>及网络资料 1.基本概念 lucence 可以认为分为两大组件: 1)索引组件 a.内容获取:即将原始的内容材料,可以是数据库.网站(爬虫).文本 ...
用lucene替代mysql读库的尝试
采用lucene对mysql中的表建索引,并替代全文检索操作. 备注:代码临时梳理很粗糙,后续修改. import java.io.File; import java.io.IOException; ...
Lucene的评分(score)机制研究
首先,需要学习Lucene的评分计算公式—— 分值计算方式为查询语句q中每个项t与文档d的匹配分值之和,当然还有权重的因素.其中每一项的意思如下表所示: 表3.5 评分公式中的因子评分因子描述 ...
Lucene的分析资料【转】
Lucene 源码剖析 1 目录 2 Lucene是什么 2.1.1 强大特性 2.1.2 API组成- 2.1.3 Hello World! 2.1.4 Lucene roadmap 3 索引文件结 ...
Lucene提供的条件判断查询
第一.按词条搜索 - TermQuery query = new TermQuery(new Term("name","word1"));hits = sear ...
Lucene 单域多条件查询
在Lucene 中 BooleanClause用于表示布尔查询子句关系的类,包括:BooleanClause.Occur.MUST表示and,BooleanClause.Occur.MUST_NOT表 ...
lucene自定义过滤器
先介绍下查询与过滤的区别和联系,其实查询(各种Query)和过滤(各种Filter)之间非常相似,可以这样说只要用Query能完成的事,用过滤也都可以完成,它们之间可以相互转换,最大的区别就是使用过滤 ...
lucene+IKAnalyzer实现中文纯文本检索系统
首先IntelliJ IDEA中搭建Maven项目(web):spring+SpringMVC+Lucene+IKAnalyzer spring+SpringMVC搭建项目可以参考我的博客整合Luc ...
全文检索解决方案（lucene工具类以及sphinx相关资料）
介绍两种全文检索的技术. 1. lucene+ 中文分词(IK) 关于lucene的原理,在这里可以得到很好的学习. http://www.blogjava.net/zhyiwww/archive/ ...
MySQL和Lucene索引对比分析
MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr.ElasticSearch)的核心类库.两者的索引(index)有什么区别呢?以前写过 ...

随机推荐

C#------对SQLServer进行简单的增，删，改，查
EF中的操作转载: http://www.cnblogs.com/mcgrady/archive/2015/03/21/4355282.html PSContext db = new PSContex ...
Axure7.0汉化方法
下载汉化包 AxureRP7CN_汉化包.rar 首先退出正在运行中的 Axure (如果您正在使用). 将汉化包.rar 文件解压, 得到 lang 文件夹, 然后将其复制到 Axure 安装目 ...
20145212 《Java程序设计》第1周学习总结
20145212 <Java程序设计>第1周学习总结教材学习内容总结看了毕向东老师的视频,我对Java有了进一步的了解.相比于其他的计算机编程语言(比如C语言),Java有一大特点就是 ...
rem是如何实现自适应布局的？
http://caibaojian.com/web-app-rem.html 使用rem 然后根据媒体查询实现自适应.跟使用JS来自适应适配也是同个道理,不过是js更精确一点.使用媒体查询: html ...
GIT安装完需要做以下配置
安装完GIT后需要做以下配置: 一.找到git的安装目录,查找etc目录下的gitconfig配置文件,编辑此文件在最后一行添加如下内容: [gui] encoding = utf-8 [sv ...
ecshop新增一个编辑器
在ecshop的后台新增一个编辑器框步骤一:找到lib_main.php 文件:admin/includes/lib_main.php. 找到变量:function create_html_edit ...
C#如何把List of Object转换成List of T具体类型
上周码程序的时候碰到个问题,因为设计上的约束,一个方法接受的参数只能为List<object>类型,然而该方法需要处理的真实数据则是确定的List<Currency>.然而C# ...
Java Servlet系列之Servlet生命周期
Servlet生命周期定义了一个Servlet如何被加载.初始化,以及它怎样接收请求.响应请求,提供服务.在讨论Servlet生命周期之前,先让我们来看一下这几个方法: 1. init()方法在Se ...
Lua 之数据结构
Lua 之数据结构数组通过整数下标访问的table中的元素,即是数组,下标默认从1开始. 一个创建二维数组的例子: mt = {} , do mt[i] = {} , do mt[i][j] = ...
注入问题0x00
1.sqlmap遇到MySQL注入可以成功getshell,但是,遇到sqlserver注入未成功getshell. 2.xp_cmdshell 如何 getshell(1433未对外开放). 解决方 ...

有关lucene的问题

有关lucene的问题的更多相关文章

随机推荐

热门专题