.NET 6全文检索引擎Lucene.NET 4.8简单封装

前言

因为最近在做一个检索数据的工具。最开始用的Mysql8自带的全文检索功能。但是发现这货数据量超过百万之后，检索速度直线下降。

于是想到Lucene.net。花了一晚上时间做了简单的封装。可以直接用于博客网站站内搜索等简单使用场景。

目前做了几个简单的封装

创建索引
jiba.net分词检索
检索分页
按字段检索
字段排序
索引删除

如何使用？

已经封装成了nuget包，并上传到nuget上，可以直接安装 dotnet add package EasyLuceneNET 也可以直接在vs里面搜索

创建模型

 public class Article

    {

        [Lucene(FieldStore = Field.Store.YES, IsUnique = true, type = LuceneFieldType.Int32)]

        public int Id { get; set; }

        [Lucene(FieldStore = Field.Store.YES, IsUnique = false, type = LuceneFieldType.Text)]

        public string Title { get; set; }

        [Lucene(FieldStore = Field.Store.YES, IsUnique = false, type = LuceneFieldType.Text)]

        public string Content { get; set; }

    }

依赖注入

var service = new ServiceCollection();

service.AddLogging();

service.AddEasyLuceneNet();

var serviceProvider = service.BuildServiceProvider();

var easy = serviceProvider.GetService<IEasyLuceneNet>();

创建索引

var list = new List<Article>();

for (int i = 0; i < 100; i++)

{

    list.Add(new Article()

    {

        Id = i,

        Title = i + "使用Xamarin开发移动应用示例——数独游戏（八）使用MVVM实现完成游戏列表页面",

        Content = @"前面我们已经完成了游戏的大部分功能，玩家可以玩预制的数独游戏，也可以自己添加新的游戏。现在我们实现展示已完成游戏列表页面，显示用户已经完成的游戏列表，从这个列表可以进入详细的复盘页面。

前面的页面我们采用的是传统的事件驱动模型，在XAML文件中定义页面，在后台的cs文件中编写事件响应代码。采用这种模型是因为很多页面需要动态生成控件，然后动态改变这些控件的属性，事件驱动模型在这种场景下比较好理解。现在我们采用MVVM方式编写完成游戏列表页面。

MVVM是将页面绑定到视图模型，所有的操作和事件响应通过视图模型完成。视图模型中没有页面控件的定义，因此和页面是解耦的，可以独立进行测试。在视图模型中我们只关心数据，而不关心展示数据的控件。

首先，我们定义一个视图模型的基类，下一步在改造其它页面时，会用到这个基类："

    });

}

easy!.AddIndex(list);

检索数据



var result = easy!.Search<Article>(new SearchRequest()

{

    keyword = "事件模型",

    index = 1,

    size = 20,

    fields = new string[] { "Title", "Content" },

    OrderByField = "Id",

});

Console.WriteLine("一共:" + result.Total);

foreach (var item in result.list)

{

    Console.WriteLine($"id:{item.Id} title:{item.Title}");

}

Console.WriteLine($"分词:{string.Join(" ", result.cutKeys)}");

Console.WriteLine("完成");

删除索引

传递一个文档对应的模型，只需要给主键赋值即可

easy.Delete(new Article { Id = 1 });

基本的检索就差不多到这里结束了，如果需要自己更新词库，可以下载源码自己编译，或者我后面有时间把词库单独弄出来

源码

https://github.com/coolqingcheng/EasyLuceneNET

点击直接跳到github

关注我

欢迎大家关注我的公众号【网上冲浪程序员】，不定时和你分享

.NET 6全文检索引擎Lucene.NET 4.8简单封装的更多相关文章

Apache Lucene(全文检索引擎)—创建索引
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
全文检索引擎　Lucene.net
全文搜索引擎是目前广泛应用的主流搜索引擎.它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行 ...
Lucene：基于Java的全文检索引擎简介
Lucene:基于Java的全文检索引擎简介 Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引/检索引擎--Lucene Lucene不是一个完整的全文索引应用,而是是一个用J ...
Lucene 全文检索引擎
Apache Lucene PS: 苦学一周全文检索,由原来的搜索小白,到初次涉猎,感觉每门技术都博大精深,其中精髓亦是不可一日而语.那小博猪就简单介绍一下这一周的学习历程, 仅供各位程序猿们参考,这 ...
Lucene：基于Java的全文检索引擎简介 (zhuan)
http://www.chedong.com/tech/lucene.html ********************************************** Lucene是一个基于Ja ...
Lucene作为一个全文检索引擎
Lucene作为一个全文检索引擎,其具有如下突出的优点: (1)索引文件格式独立于应用平台.Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件. ...
全文检索引擎及工具 Lucene Solr
全文检索引擎及工具 lucence lucence是一个全文检索引擎. lucence代码级别的使用步骤大致如下: 创建文档(org.apache.lucene.document.Document), ...
【Lucene】Apache Lucene全文检索引擎架构之入门实战1
Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供.Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻.在Java开发环境里Lucene是一个成熟的 ...
全文检索引擎 Solr 部署与基本原理
全文检索引擎 Solr 部署与基本原理搜索引擎Solr环境搭建实例关于 solr , schema.xml 的配置说明全文检索引擎Solr系列-–全文检索基本原理一.搜索引擎Solr环境搭建实 ...

随机推荐

Zookeeper基础教程（五）：C#实现Zookeeper分布式锁
分布式锁互联网初期,我们系统一般都是单点部署,也就是在一台服务器完成系统的部署,后期随着用户量的增加,服务器的压力也越来越大,响应速度越来越慢,甚至出现服务器崩溃的情况. 为解决服务器压力太大,响应 ...
python使用String的Template进行参数动态替换
1.前言: 之前使用string的find(),从指定的param里面查找,是否包含了某个字符,有的话,使用replace进行替换,一个接口的param要替换的参数少的话,使用这种方式,的确可行,如果 ...
初识python：类练习 - 老板&员工
需求: 1.员工具有姓名.年龄.能力值(能力值为100-年龄),可以工作,每工作一次,该员工的能力值-5,创建__str__方法,打印该员工的信息: 2.老板具有投资金额,工作量,员工列表.可以雇佣员 ...
单元测试报错 org.junit.runners.model.InvalidTestClassError: Invalid test class 'com.example.xxx' 解决
1.前言很奇怪 ,单元测试正常执行,但是结束后会报错 org.junit.runners.model.InvalidTestClassError: Invalid test class 'com.e ...
Hadoop学习-块、网络拓扑、副本策略、机架感知
原文链接:https://www.toutiao.com/i6627682068203586062/ 一.我们先看一个大数据的实例进到官网我们进入到里面有个"网站统计" 我们查 ...
SYCOJ137斜线输出(1)
题目-斜线输出(1) (shiyancang.cn) 在同一斜线上的满足方程.坐标关系计算即可. #include<bits/stdc++.h> using namespace std; ...
403 Invalid CORS request 跨域问题 invalid+cors+request什么意思
5.跨域问题跨域:浏览器对于javascript的同源策略的限制 . 以下情况都属于跨域: 跨域原因说明示例域名不同 www.jd.com 与 www.taobao.com 域名相同,端口不同 ...
机器学习&恶意代码静态检测
目录分析工具方法概述二进制灰度图字节(熵)直方图字符串信息 ELF结构信息源码分析与OPcode FCG references: 分析工具 readelf elfparser ninja ...
css3中transition属性详解
css3中通过transition属性可以实现一些简单的动画过渡效果~ 1.语法 transition: property duration timing-function delay; transi ...
《剑指offer》刷题目录
<剑指offer>刷题目录面试题03. 数组中重复的数字面试题04. 二维数组中的查找面试题05. 替换空格面试题06. 从尾到头打印链表面试题07. 重建二叉树面试题09. ...