使用Lucene.Net管理索引实现搜索

之前使用一直是没有问题的，只到今天发现删除的时候无法删除，增加的时候却一直在增加，导致搜索的时候可以搜出来很多相同的结果。

小猪决定趁今天这个机会好好的把这个问题给解决了。

private void ProcessJobs(IndexWriter writer)

{

    while (jobs.Count != )

    {

        IndexJob job = jobs.Dequeue();

        writer.DeleteDocuments(new Term("Id", job.Id.ToString()));//先执行删除的操作

        //如果“添加文章”任务再添加，

        if (job.JobType == JobType.Add)

        {

            BLL.BooksManage bll = new BLL.BooksManage();

            Entity.Books art = bll.GetById(job.Id);

            if (art == null)//有可能刚添加就被删除了

            {

                continue;

            }

            //string channel_id = art.channel_id.ToString();

            string title = art.Title;

            DateTime time = art.CreateDate;

            string content = Utils.DropHTML(art.Brief.ToString());

            string Addtime = art.CreateDate.ToString("yyyy-MM-dd");

            Document document = new Document();

            //只有对需要全文检索的字段才ANALYZED

            document.Add(new Field("Id", job.Id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Title", title, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Tag", art.Tag, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("PubTime", art.PubTime.ToString("yyyy-MM-dd"), Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Cover", art.Cover, Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Author", art.Author == null ? "" : art.Author, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Translator", art.Translator == null ? "" : art.Translator, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Publisher", art.Publisher == null ? "" : art.Publisher, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Language", art.Language, Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Brief", Utils.DropHTML(art.Brief.ToString()), Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Icon", art.Icon, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Rate", art.Rate.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Price", art.Price.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Device", art.Device, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("EngineVersion", art.EngineVersion.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("ContentType", art.ContentType, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Size", art.Size.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Status", art.Status.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Other2", art.Other2, Field.Store.YES, Field.Index.ANALYZED));

            writer.AddDocument(document);

            logger.Debug("索引" + job.Id + "完毕");

        }

        else

        { 

        }

    }

}

之前小猪还在想为什么这里没有处理删除的逻辑，仔细看了下发现只要增加了任务不管是删除还是添加都会先执行删除操作以防止索引结果的重复。问题就出现在这里，依照什么规则来删除呢？之前小猪直接用的别人的代码，今天才发现需要自己定义删除的规则：

writer.DeleteDocuments(new Term("number", job.Id.ToString()))

另外就是要处理好啥时候删除，啥时候增加的逻辑。不然很容易出现各种问题，例如数据库中没有而索引里有的，或者数据库里有的但是不可用的但是搜索出来的等等等等~~

使用Lucene.Net管理索引实现搜索的更多相关文章

lucene简介创建索引和搜索初步
lucene简介创建索引和搜索初步一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引 ...
搜索引擎系列 ---lucene简介创建索引和搜索初步
一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎 :Lucene得名于Doug妻子 ...
Lucene第二讲——索引与搜索
一.Feild域 1.Field域的属性是否分词:Tokenized 是:对该field存储的内容进行分词,分词的目的,就是为了索引. 否:不需要对field存储的内容进行分词,不分词,不代表不索引 ...
Lucene.net 从创建索引到搜索的代码范例
关于Lucene.Net的介绍网上已经很多了在这里就不多介绍Lucene.Net主要分为建立索引,维护索引和搜索索引Field.Store的作用是通过全文检查就能返回对应的内容,而不必再通过id去DB ...
JAVAEE——Solr：安装及配置、后台管理索引库、使用SolrJ管理索引库、仿京东的电商搜索案例实现
1 学习回顾 1. Lucene 是Apache开源的全文检索的工具包创建索引查询索引 2. 遇到问题? 文件名及文件内容顺序扫描法全文检索 3. 什么是全文检索? 这种先创建索引再 ...
理解Lucene索引与搜索过程中的核心类
理解索引过程中的核心类执行简单索引的时候需要用的类有: IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWr ...
lucene索引并搜索mysql数据库[转]
由于对lucene比较感兴趣,本人在网上找了点资料,终于成功地用lucene对mysql数据库进行索引创建并成功搜索,先总结如下: 首先介绍一个jdbc工具类,用于得到Connection对象: im ...
Lucene中最简单的索引和搜索示例
package com.jiaoyiping.lucene; import org.apache.lucene.analysis.standard.StandardAnalyzer; import o ...
用Lucene.net对数据库建立索引及搜索<转>
用Lucene.net对数据库建立索引及搜索最近我一直在研究 Lucene.net ,发现Lucene.net对数据库方面建索引的文章在网上很少见,其实它是可以对数据库进行索引的,我闲着没事,写了个 ...

随机推荐

E2 2014.5.8 更新日志
增加功能增加报价单功能,可以针对指定客户生成报价单,可以直接生成一个在线地址,直接把地址发给客户在线打开传统的报价,先生成一个EXCEL,再传给客户,使用E2,这一切都变得简单,你可生成一个在线地 ...
mysql概要（十五）存储过程
1.定义: 2.查看所有存储过程: show procedure status; 3.创建存储过程: create procedure 存储过程名字(参数) begin s1l语句; end$ ...
Visual Studio 2012 RC 中RC表示什么意思
来自:http://zhidao.baidu.com/question/507233956.html Release Candidate 缩写为 RC ,经常用于计算机软件方面,表示软件的候选发布版. ...
Xpert 基础
----------------------- 01 ------------------------------- declare cursor emp_cur is select empname ...
linux 通过 ulimit 改善系统性能
https://www.ibm.com/developerworks/cn/linux/l-cn-ulimit/ 概述系统性能一直是一个受关注的话题,如何通过最简单的设置来实现最有效的性能调优,如何 ...
iOS开发之总结
NO.1 要孜孜不倦的学习有句话叫技多不压身,编程本来就是一个更新换代非常快的工作.每年都有新的技术出现,我认为要成为一个出色的程序员只掌握一门语言肯定是不行的.那么,要怎么选择自己的第二门,甚至第三 ...
【转载】【Centos linux系统】命令行（静默）安装oracle 11gR2
[原文]:http://blog.chinaunix.net/uid-23886490-id-3565998.html 一.安装前准备 1.内存及swap要求至于swap如何添加,后文将提到 gre ...
python模块以及导入出现ImportError: No module named 'xxx'问题
python中,每个py文件被称之为模块,每个具有__init__.py文件的目录被称为包.只要模块或者包所在的目录在sys.path中,就可以使用import 模块或import 包来使用如果你要使 ...
Css_2跟3
#css2中的选择器 1.元素选择器 *通配符选择符.html类型选择符.id选择符.class选择符 2.关系选择器 E F(包含选择器).E>F(子选择器).E+F(E元素后 ...
按钮靠右css小结
按钮靠右 style="float:right" ,多按钮排版会相反按钮内的字体靠右 style="text-align:right" 按钮离右边框距离 s ...

使用Lucene.Net管理索引实现搜索

使用Lucene.Net管理索引实现搜索的更多相关文章

随机推荐

热门专题