Lucene入门实例-CRUD
1、导入jar包
lucene-analyzers-common-7.6.0.jar
lucene-analyzers-smartcn-7.6.0.jar
lucene-core-7.6.0.jar
2、代码
package org.longIt.Lucene_app;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StringField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.*;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import java.nio.file.Paths;
public class LuceneIndex {
public static void main(String[] args) {
addIndex();
//searchIndex();
//deleteIndex();
//updateIndex();
}
private static void updateIndex() {
// TODO Auto-generated method stub
try {
//指定索引库的目录
Directory directory = FSDirectory.open(Paths.get("D:\\study\\lucene\\lucene_index\\article_tb"));
//创建分词器 暂时使用 单字分词器 后期再改善
Analyzer analyzer = new StandardAnalyzer();
//创建IndexWriterConfig实例,通过IndexWriterConfig实例来指定创建索引的相关信息,比如指定分词器
IndexWriterConfig config = new IndexWriterConfig(analyzer);
//指定索引的创建方式
config.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);
//创建索引 更新索引 删除索引都是IndexWriter来实现
IndexWriter indexWriter = new IndexWriter(directory,config);
//一个Document实例代表一条记录
Document document = new Document();
/**
* StringField不会对关键字进行分词
* Store.YES:会对数据进行存储并分词,如果为NO则不会对数据进行存储,索引还是会创建
*
* */
document.add(new StringField("articleId", "0001", Field.Store.YES));
document.add(new TextField("title", "幽幽而来", Field.Store.YES));
document.add(new TextField("content", "这世间,必有一种懂得是精神,穿越灵魂", Field.Store.YES));
/**
* 通过indexWriter将数据写入至索引库
* 更新的原理是先删除之前的索引,再创建新的索引,相当于更新是 删除与添加两个动作的合集
* **/
indexWriter.updateDocument(new Term("articleId","0001"), document);
//提交事务
indexWriter.commit();
//关闭流资源
indexWriter.close();
System.out.println("=======索引更新成功======");
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
public static void addIndex() {
try {
Directory directory = FSDirectory.open(Paths.get("D:\\study\\lucene\\lucene_index\\article_tb"));
//创建IndexWriterConfig实例,通过IndexWriterConfig实例来指定创建索引的相关信息,比如指定分词器
//创建分词器 暂时使用 单字分词器 后期再改善
Analyzer analyzer = new StandardAnalyzer();
IndexWriterConfig config = new IndexWriterConfig(analyzer);
//指定索引的创建方式
config.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);
//创建索引 更新索引 删除索引都是IndexWriter来实现
IndexWriter indexWriter = new IndexWriter(directory, config);
//一个Document实例代表一条记录
Document document = new Document();
/**
* StringField不会对关键字进行分词
* Store.YES:会对数据进行存储并分词,如果为NO则不会对数据进行存储,索引还是会创建
*
* */
document.add(new StringField("articleId", "0001", Field.Store.YES));
document.add(new TextField("title", "懂得人生0001", Field.Store.YES));
document.add(new TextField("content", "一生一世", Field.Store.YES));
//通过indexWriter将数据写入至索引库
indexWriter.addDocument(document);
//提交事务
indexWriter.commit();
//关闭流资源
indexWriter.close();
System.out.println("=======索引创建成功======");
} catch (Exception e) {
e.printStackTrace();
}
}
public static void searchIndex() {
try {
Directory directory = FSDirectory.open(Paths.get("D:\\study\\lucene\\lucene_index\\article_tb"));
//DirectoryReader的open方法指定需要读取的索引库信息,并返回相应的实例
IndexReader indexReader = DirectoryReader.open(directory);
//创建IndexSearcher实例,通过IndexSearcher实例进行全文检索
IndexSearcher indexSearcher = new IndexSearcher(indexReader);
/*
通过indexSearcher进行检索并指定两个参数
第一个参数:封装查询的相关信息,比如说查询的关键字,是否需要分词或者需要分词的话采取什么分词器
第二个参数:最多只要多少条记录
TermQuery:中指定了查询的关键字以及查询哪一个字段
TermQuery不会对关键字进行分词
*/
Query query = new TermQuery(new Term("title","幽"));
//查询索引表,最终数据都被封装在 TopDocs的实例中
TopDocs topDocs = indexSearcher.search(query,10);
//通过topDocs获取匹配全部记录
ScoreDoc[] scoreDocs = topDocs.scoreDocs;
System.out.println("获取到的记录数:"+scoreDocs.length);
for (int i = 0; i < scoreDocs.length; i++) {
//获取记录的id
int id = scoreDocs[i].doc;
//文章的得分
float score = scoreDocs[i].score;
System.out.println("id:"+id+" 分章的得分:"+score);
//查询数据表
Document document = indexSearcher.doc(id);
String articleId = document.get("articleId");
String title = document.get("title");
String content = document.get("content");
System.out.println("articleId:"+articleId+" title:"+title+" content:"+content);
}
} catch (Exception e) {
e.printStackTrace();
}
}
private static void deleteIndex() {
// TODO Auto-generated method stub
try {
//指定索引库的目录
Directory directory = FSDirectory.open(Paths.get("D:\\study\\lucene\\lucene_index\\article_tb"));
//创建分词器 暂时使用 单字分词器 后期再改善
Analyzer analyzer = new StandardAnalyzer();
//创建IndexWriterConfig实例,通过IndexWriterConfig实例来指定创建索引的相关信息,比如指定分词器
IndexWriterConfig config = new IndexWriterConfig(analyzer);
//指定索引的创建方式
config.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);
//创建索引 更新索引 删除索引都是IndexWriter来实现
IndexWriter indexWriter = new IndexWriter(directory,config);
//删除指定的索引
indexWriter.deleteDocuments(new Term("articleId","0001"));
//删除索引库中全部的索引
//indexWriter.deleteAll();
//提交事务
indexWriter.commit();
//关闭流资源
indexWriter.close();
System.out.println("=======索引删除成功======");
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
Lucene入门实例-CRUD的更多相关文章
- Lucene建立索引搜索入门实例
第一部分:Lucene建立索引 Lucene建立索引主要有以下两步:第一步:建立索引器第二步:添加索引文件准备在f盘建立lucene文件夹,然后 ...
- springboot + mybatisPlus 入门实例 入门demo
springboot + mybatisPlus 入门实例 入门demo 使用mybatisPlus的优势 集成mybatisplus后,简单的CRUD就不用写了,如果没有特别的sql,就可以不用ma ...
- React 入门实例教程(转载)
本人转载自: React 入门实例教程
- struts入门实例
入门实例 1 .下载struts-2.3.16.3-all .不摆了.看哈就会下载了. 2 . 解压 后 找到 apps 文件夹. 3. 打开后将 struts2-blank.war ...
- Vue.js2.0从入门到放弃---入门实例
最近,vue.js越来越火.在这样的大浪潮下,我也开始进入vue的学习行列中,在网上也搜了很多教程,按着教程来做,也总会出现这样那样的问题(坑啊,由于网上那些教程都是Vue.js 1.x版本的,现在用 ...
- wxPython中文教程入门实例
这篇文章主要为大家分享下python编程中有关wxPython的中文教程,分享一些wxPython入门实例,有需要的朋友参考下 wxPython中文教程入门实例 wx.Window 是一个基类 ...
- Omnet++ 4.0 入门实例教程
http://blog.sina.com.cn/s/blog_8a2bb17d01018npf.html 在网上找到的一个讲解omnet++的实例, 是4.0下面实现的. 我在4.2上试了试,可以用. ...
- Spring中IoC的入门实例
Spring中IoC的入门实例 Spring的模块化是很强的,各个功能模块都是独立的,我们可以选择的使用.这一章先从Spring的IoC开始.所谓IoC就是一个用XML来定义生成对象的模式,我们看看如 ...
- Node.js入门实例程序
在使用Node.js创建实际“Hello, World!”应用程序之前,让我们看看Node.js的应用程序的部分.Node.js应用程序由以下三个重要组成部分: 导入需要模块: 我们使用require ...
随机推荐
- bzoj3276磁力 两种要求下的最大值:分块or线段树+拓扑
进阶指南上的做法是分块的.. 但是线段树搞起来也挺快,将磁石按照距离排序,建立线段树,结点维护区间质量最小值的下标 进行拓扑,每次在可行的范围内在线段树中找到质量最小的下标取出,取出后再将线段树对应的 ...
- 20165314 2016-2017-2 《Java程序设计》第9周学习总结
20165314 2016-2017-2 <Java程序设计>第9周学习总结 教材学习内容总结 URl类 UDP数据报 广播数据报 套接字 套接字连接机制 代码托管
- XMind思维导图使用笔记
首先新建一个空白的图 以组织结构图(向下) 为例 1.双击组织结构图 创建一个空白的页面 2.随便选择一个风格 这时候出现工作台 现在里面只有一个中心主题 正文部分开始 1.如果想要添加一个子主题 ...
- 通过awk 和 sed 将多余的列剔除
通过awk 和 sed 将多余的列剔除 名词注释: awk -F 指定分隔符 OFS 指定输出分隔符 sed sed "s/|/test/2" a.log 将第二个 | 线替换为 ...
- windows下载安装MariaDB10.2.17 绿色版
1.下载 https://mirrors.tuna.tsinghua.edu.cn/mariadb//mariadb-10.2.17/winx64-packages/mariadb-10.2.17-w ...
- golang ffmpeg 做网络直播
最近在公司做在线视频转码的工作,研究了下ffmpeg 最后直接研究了下网络直播,我是在我自己的mac 上面测试的,效果,还可以,先看看效果图吧 ffmpeg 我是通过brew安装 的,这步就略了 VL ...
- 基于nopcommerce b2c开源项目的精简版开发框架Nop.Framework
http://www.17ky.net/soft/70612.html?v=1#0-sqq-1-39009-9737f6f9e09dfaf5d3fd14d775bfee85 项目详细介绍 该开源项目是 ...
- Codeforces 1017F The Neutral Zone (看题解)
这题一看就筛质数就好啦, 可是这怎么筛啊, 一看题解, 怎么会有这么骚的操作. #include<bits/stdc++.h> #define LL long long #define f ...
- bug管理
BUG提交规范 1.标题 2.步骤描述 ①.步骤使用序号编排 ②.在特定情况下发生的问题,还需提供准确的前提条件 ③.精准的描述bug产生的路径后,再描述现象 如: >打开客户端进行首页-> ...
- hive提前过滤重要性
hive提前过滤 create table sospdm.tmp_yinfei_test_01 ( id string ) partitioned by (statis_date string) ; ...