Lucence.Net学习+盘古分词

创建索引库

//读取文件，存储到索引库

public string CreateDatebase()

{

//获取索引库的路径

var indexPath = AppDomain.CurrentDomain.BaseDirectory + ConfigurationManager.AppSettings["IndexDateBase"];

FSDirectory directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NoLockFactory());

IndexReader reader = IndexReader.Open(directory, true);

var searcher = new IndexSearcher(reader);

//搜索条件

var query = new PhraseQuery();

foreach (string word in GetPanGuAnalyzer(str))//先用空格，让用户去分词，空格分隔的就是词“计算机专业”

{

query.Add(new Term("body", word));

}

//组成词的字之间可以允许的距离

query.SetSlop(5);

TopScoreDocCollector collector = TopScoreDocCollector.create(1000, true);

searcher.Search(query, null, collector);//根据query查询条件进行查询，查询结果放入collector容器

ScoreDoc[] docs = collector.TopDocs(0, collector.GetTotalHits()).scoreDocs;//得到所有查询结果中的文档,GetTotalHits():表示总条数 TopDocs(300, 20);//表示得到300（从300开始），到320（结束）的文档内容.

var list = new List<string>();

for (int i = 0; i < docs.Length; i++)

{

int docId = docs[i].doc;//得到查询结果文档的id（Lucene内部分配的id）

Document doc = searcher.Doc(docId);//找到文档id对应的文档详细信息

var _str = doc.Get("body");

list.Add(_str);

}

ViewBag.List = list;

return View();

}

进行搜索

public ActionResult List(string str)

{

//获取索引库的路径

var indexPath = AppDomain.CurrentDomain.BaseDirectory + ConfigurationManager.AppSettings["IndexDateBase"];

FSDirectory directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NoLockFactory());

IndexReader reader = IndexReader.Open(directory, true);

var searcher = new IndexSearcher(reader);

//搜索条件

var query = new PhraseQuery();

foreach (string word in GetPanGuAnalyzer(str))//先用空格，让用户去分词，空格分隔的就是词“计算机专业”

{

query.Add(new Term("body", word));

}

//组成词的字之间可以允许的距离

query.SetSlop(5);

TopScoreDocCollector collector = TopScoreDocCollector.create(1000, true);

searcher.Search(query, null, collector);//根据query查询条件进行查询，查询结果放入collector容器

var list = new List<string>();

for (int i = 0; i < docs.Length; i++)

{

int docId = docs[i].doc;//得到查询结果文档的id（Lucene内部分配的id）

Document doc = searcher.Doc(docId);//找到文档id对应的文档详细信息

var _str = doc.Get("body");

list.Add(_str);

}

ViewBag.List = list;

return View();

}

/// 对传递过来的字符串进行盘古分词

/// </summary>

/// <returns></returns>

public static List<string> GetPanGuAnalyzer(string txt)

{

List<string> list = new List<string>();

Analyzer analyzer = new PanGuAnalyzer();

TokenStream tokenStream = analyzer.TokenStream("", new StringReader(txt));

Lucene.Net.Analysis.Token token = null;

while ((token = tokenStream.Next()) != null)

{

list.Add(token.TermText());

}

return list;

}

IndexReader 删除数据

//获取字典

var directory = LucenceHelp.GetDirectory();

//先删除数据

IndexReader reader = IndexReader.Open(directory);

reader.DeleteDocuments(new Term("number", "0"));

reader.IsOptimized();

reader.Close();

IndexWriter 删除数据

//获取字典

var directory = LucenceHelp.GetDirectory();

var writer = new IndexWriter(directory, new PanGuAnalyzer(), false, IndexWriter.MaxFieldLength.UNLIMITED);

//删除的是与要匹配的关键字相关的文件

var term = new Term("body", name);

//删除的是文件名为13的文件

//var term = new Term("number", "13");

writer.DeleteDocuments(term);

writer.Optimize();

writer.Close();

修改索引

Analyzer analyzer = new PanGuAnalyzer();

//获取字典

var directory = LucenceHelp.GetDirectory();

//先删除数据

IndexReader reader = IndexReader.Open(directory);

reader.DeleteDocuments(new Term("number", "0"));

reader.Close();

//再添加数据

IndexWriter writer = new IndexWriter(directory, analyzer, false, IndexWriter.MaxFieldLength.LIMITED);

Document document = new Document();

document.Add(new Field("number", "0", Field.Store.YES, Field.Index.ANALYZED));

document.Add(new Field("body", "如家快捷酒店-0", Field.Store.YES, Field.Index.ANALYZED));

writer.AddDocument(document);

writer.Close();

要添加的文件

Lucence.Net学习+盘古分词的更多相关文章

lucence.net+盘古分词
第一步: 添加盘古和lucence的dll引用第二步: 拷贝Dict文件夹到项目 demo里面是Dictionaries 不过官方建议改成Dict 然后把所有项右击属性改为“如果较新则复制” 第 ...
Lucene.net入门学习（结合盘古分词）
Lucene简介 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整 ...
Lucene.Net3.0.3+盘古分词器学习使用
一.Lucene.Net介绍 Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索 ...
Lucene.net入门学习（结合盘古分词）（转载）
作者:释迦苦僧出处:http://www.cnblogs.com/woxpp/p/3972233.html 本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显 ...
站内搜索——Lucene +盘古分词
为了方便的学习站内搜索,下面我来演示一个MVC项目. 1.首先在项目中[添加引入]三个程序集和[Dict]文件夹,并新建一个[分词内容存放目录] Lucene.Net.dll.PanGu.dll.Pa ...
Lucene.Net+盘古分词
前言各位朋友,谢谢大家的支持,由于文件过大,有考虑到版权的问题,故没有提供下载,本人已建立一个搜索技术交流群:77570783,源代码已上传至群共享,需要的朋友,请自行下载! 首先自问自答几个问题, ...
完整的站内搜索Demo(Lucene.Net+盘古分词)
前言首先自问自答几个问题,以让各位看官了解写此文的目的什么是站内搜索?与一般搜索的区别? 很多网站都有搜索功能,很多都是用SQL语句的Like实现的,但是Like无法做到模糊匹配(例如我搜索“.n ...
lucene.net 3.0.3、结合盘古分词进行搜索的小例子(转)
lucene.net 3.0.3.结合盘古分词进行搜索的小例子(分页功能) 添加:2013-12-25 更新:2013-12-26 新增分页功能. 更新:2013-12-27 新增按分类查询功能, ...
完整的站内搜索实战应用(Lucene.Net+盘古分词)
首先自问自答几个问题,以让各位看官了解写此文的目的什么是站内搜索?与一般搜索的区别? 多网站都有搜索功能,很多都是用SQL语句的Like实现的,但是Like无法做到模糊匹配(例如我搜索". ...

随机推荐

JSON 解析器。JSON.stringify和JSON.parse
以前用的是JavaScript 的eval. 现在JSON 提供了JSON.stringify和JSON.parse两个函数. JSON.parse用于从一个字符串中解析出json对象. JSON. ...
Cocos2d—X游戏开发之CCTableView详解（十一）
本来很早就想写关于CCTableView的文章,但是在基本功能实现之后呢,项目需求增加导致对这个控件的研究必须更加深入一点. 好的,现在开始介绍一下这个控件,在Cocos2d—X引擎中,这是一个仿制i ...
Android的MVC框架
http://www.cnblogs.com/wanghafan/archive/2012/07/20/2600786.html MVC是当前比较流行的框架,随便Google下,就可以发现几乎所有的应 ...
svm评价指标公式
在做svm分类试验时,对于结果的处理,仅用一种指标很难得到正确评估算法的效果.所以,一般要用到precision(精确率),recall(召回率),F-measure.accuracy(准确率)四个指 ...
Hibernate工作流程
Hibernate创建步骤 (五大核心接口:Configuration/SessionFactory/Session/Transaction/Query) 1.新建工程,导入需要的jar包. 2.利用 ...
SqlDataAdapter.Update批量数据更新
SqlDataAdapter.Update批量数据更新使用SqlDataAdapter.Update可以方便地对数据库进行快速.批量数据更新.我们最常用的多条数据更新方法是使用循环多次执行SQL语句 ...
python打包成exe
目前有三种方法可以实现python打包成exe,分别为 py2exe Pyinstaller cx_Freeze 其中没有一个是完美的 1.py2exe的话不支持egg类型的python库 2.Pyi ...
多关键字排序（里面有关于操作符（<<运算符和 >>运算符）的重载）
一种排序时间限制:3000 ms | 内存限制:65535 KB 难度:3 描述现在有很多长方形,每一个长方形都有一个编号,这个编号可以重复:还知道这个长方形的宽和长,编号.长.宽都是整数:现 ...
我使用过的Linux命令
我使用过的Linux命令之tee - 重定向输出到多个文件用途说明在执行Linux命令时,我们可以把输出重定向到文件中,比如 ls >a.txt,这时我们就不能看到输出了,如果我们既想把输出 ...
模块化定义JS，让统一文件夹内相同的变量不冲突
两种方法: 1.(function(){……编写代码……})() //先声明一个函数,声明完后直接调用 2.!function(){……编写代码……}()

Lucence.Net学习+盘古分词

Lucence.Net学习+盘古分词的更多相关文章

随机推荐

热门专题