（三）Lucene——Field域和索引的增删改

1. Field域

1.1 Field的属性

是否分词（Tokenized）

是：对该field存储的内容进行分词，分词的目的，就是为了索引。

　　比如：商品名称、商品描述、商品价格

否：不需要对field存储的内容进行分词，不分词，不代表不索引，而是将整个内容进行索引。

　　比如：商品id

是否索引（Indexed）

是：将分好的词进行索引，索引的目的，就是为了搜索。

　　比如：商品名称、商品描述、商品价格、商品id

否：不索引，也就是不对该field域进行搜索。

是否存储（Stored）

是：将field域中的内容存储到文档域中。存储的目的，就是为了搜索页面显示取值用的。

　　比如：商品名称、商品价格、商品id、商品图片地址

否：不将field域中的内容存储到文档域中。不存储，则搜索页面中没法获取该field域的值。

　　比如：商品描述，由于商品描述在搜索页面中不需要显示，再加上商品描述的内容比较多，所以就不需要进行存储。如果需要商品描述，则根据搜索出的商品ID去数据库中查询，然后显示出商品描述信息即可。

1.2 Field的常用类型

下边列出了开发中常用的Filed类型，注意Field的属性，根据需求选择：

Field类	数据类型	Analyzed 是否分词	Indexed 是否索引	Stored 是否存储	说明
StringField(FieldName, FieldValue,Store.YES))	字符串	N	Y	Y或N	这个Field用来构建一个字符串Field，但是不会进行分词，会将整个串存储在索引中，比如(订单号,身份证号等) 是否存储在文档中用Store.YES或Store.NO决定
LongField(FieldName, FieldValue,Store.YES)	Long型	Y	Y	Y或N	这个Field用来构建一个Long数字型Field，进行分词和索引，比如(价格) 是否存储在文档中用Store.YES或Store.NO决定
StoredField(FieldName, FieldValue)	重载方法，支持多种类型	N	N	Y	这个Field用来构建不同类型Field 不分析，不索引，但要Field存储在文档中
TextField(FieldName, FieldValue, Store.NO) 或 TextField(FieldName, reader)	字符串或流	Y	Y	Y或N	如果是一个Reader, lucene猜测内容比较多,会采用Unstored的策略.

1.3 修改入门程序的代码

for (Book book : list) {

            document = new Document();

            // store:如果是yes，则说明存储到文档域中

            // 图书ID

            // 不分词、索引、存储 StringField

            Field id = new StringField("id", book.getId().toString(), Store.YES);

            // 图书名称

            // 分词、索引、存储 TextField

            Field name = new TextField("name", book.getName(), Store.YES);

            // 图书价格

            // 分词、索引、存储 但是是数字类型，所以使用FloatField

            Field price = new FloatField("price", book.getPrice(), Store.YES);

            // 图书图片地址

            // 不分词、不索引、存储 StoredField

            Field pic = new StoredField("pic", book.getPic());

            // 图书描述

            // 分词、索引、不存储 TextField

            Field description = new TextField("description", book.getDescription(), Store.NO);

// 将field域设置到Document对象中

            document.add(id);

　　　　　　　·············

}

2. 索引维护

2.1 需求

图书信息在数据库发生变化，所以索引库相对应的也要发生增删改变化。

2.2 增加索引

语法（具体参照创建索引的程序）：IndexWriter.addDocument(document);

   ······
   // a)创建分词器，标准分词器（分析文档，对文档中的Field域进行分词）

   Analyzer analyzer = new StandardAnalyzer();

     // b)创建IndexWriterConfig对象

   IndexWriterConfig cfg = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);

     // c)创建索引库目录，指定索引库的地址

   File indexFile = new File("D:\\DBIndex\\");

   Directory directory = FSDirectory.open(indexFile);

     // d)创建IndexWriter对象

   IndexWriter writer = new IndexWriter(directory, cfg);

     // e)通过IndexWriter对象将Document写入到索引库中

   for (Document doc : docList) {

           writer.addDocument(doc);

       }

     // f)关闭writer

   writer.close();
   ······

2.2 删除索引

增删改操作，都是需要通过IndexWriter对象来操作。

　　2.2.1 根据条件删除

Term是索引域中最小的单位。根据条件删除时，建议根据唯一键来进行删除。在solr中就是根据ID来进行删除和修改操作的。

@Test

    public void deleteIndex() throws Exception {

        // 创建分词器，标准分词器

        Analyzer analyzer = new StandardAnalyzer();

        // 创建IndexWriter

        IndexWriterConfig cfg = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);

        Directory directory = FSDirectory.open(new File("D:\\DBIndex\\"));

        // 创建IndexWriter

        IndexWriter writer = new IndexWriter(directory, cfg);

        
        // Terms
        writer.deleteDocuments(new Term("id", "1"));

        writer.close();

    }

　　2.3.2 删除全部

@Test

    public void deleteIndex() throws Exception {

        // 创建分词器，标准分词器

        Analyzer analyzer = new StandardAnalyzer();

        // 创建IndexWriter

        IndexWriterConfig cfg = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);

        Directory directory = FSDirectory.open(new File("D:\\DBIndex\\"));

        // 创建IndexWriter

        IndexWriter writer = new IndexWriter(directory, cfg);

        // Terms

        // writer.deleteDocuments(new Term("id", "1"));

        // 删除全部（慎用）

        writer.deleteAll();

        writer.close();

    }

2.4 修改索引

@Test

    public void updateIndex() throws Exception {

        // 创建分词器，标准分词器

        Analyzer analyzer = new StandardAnalyzer();

        // 创建IndexWriter

        IndexWriterConfig cfg = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);

        Directory directory = FSDirectory.open(new File("D:\\DBIndex\\"));

        // 创建IndexWriter

        IndexWriter writer = new IndexWriter(directory, cfg);

        // 第一个参数：指定查询条件

        // 第二个参数：修改之后的对象

        // 修改时如果根据查询条件，可以查询出结果，则将以前的删掉，然后覆盖新的Document对象，如果没有查询出结果，则新增一个Document

        // 修改流程即：先查询，再删除，在添加

        Document doc = new Document();

        doc.add(new TextField("name", "lisi", Store.YES));

        writer.updateDocument(new Term("name", "zhangsan"), doc);

        writer.close();

    }

（三）Lucene——Field域和索引的增删改的更多相关文章

Lucene 的 Field 域和索引维护
一.Field 域 1.Field 属性 Field 是文档中的域,包括 Field 名和 Field 值两部分,一个文档可以包括多个 Field,Document 只是 Field 的一个承载体,F ...
列表(索引切片增删改查嵌套) range 元组的初识
li = ["alex", "WuSir", "ritian", "barry", "wenzhou" ...
elasticsearch索引的增删改查入门
为了方便直观我们使用Head插件提供的接口进行演示,实际上内部调用的RESTful接口. RESTful接口URL的格式: http://localhost:9200/<index>/&l ...
ElasticSearch6（三）-- Java API实现简单的增删改查
基于ElasticSearch6.2.4, Java API创建索引.查询.修改.删除,pom依赖和获取es连接可查看此文章. package com.xsjt.learn; import java ...
Golang中map的三种声明方式和简单实现增删改查
package main import ( "fmt" ) func main() { test3 := map[string]string{ "one": & ...
ASP.NET CORE系列【三】使用Entity Framework Core进行增删改查
身份验证以前我们熟悉的web.config中配置的form验证,现在没有了.我们来看看在Core里面如何配置: 首先需要NuGet安装一个包:Microsoft.AspNetCore.Authent ...
上手spring boot项目(三)之spring boot整合mybatis进行增删改查的三种方式。
1.引入依赖. <dependency> <groupId>org.springframework.boot< ...
上手spring boot项目(三)之spring boot整合mybatis进行增删改查
使用mybatis框架进行增删改查大致有两种基础方式,一种扩展方式.两种基础方式分别是使用xml映射文件和使用方法注解.扩展方式是使用mybatis-plus的方式,其用法类似于spring-data ...
lucene_03_索引的增删改查
lucene索引的添加见 http://www.cnblogs.com/getchen/p/8615276.html 入门代码. 公共代码 public <T extends Query> ...

随机推荐

【拓扑排序】Genealogical tree
[POJ2367]Genealogical tree Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 5696 Accep ...
【FFT卷积】BZOJ3527-力
[题目大意] [思路] 很好这很FFT…… 想了半天也没明白到底什么是卷积∑的上下界,我当初学的时候没说一定要从0开始啊quq 我还是背不出FFT的模板我要狗带了我上面写的什么乱七八糟的,要什么数学 ...
使用redis时出现java.util.ArrayList cannot be cast to java.lang.Long
java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Long at redis.clients. ...
搭建maven支持的web工程的步骤
搭建一个新的web project的整体思路:先用maven搭建项目的骨架,生成mvn project,然后将mvn project转换为web project,最后添加相关的Spring,hiber ...
HMAC结合“挑战/响应”保障数据传输安全
1.流程图: HMAC的一个典型应用是结合“挑战/响应”(Challenge/Response)来保障客户端和服务器传输数据的安全性 . 2.安全性分析: 使用的密钥是双方事先约定的,第三方不可能知道 ...
.Net的差评
.NET平台很棒.真的很棒.直到它不再那么棒.我为什么不再用.NET?简单来说,它限制了我们选择的能力(对我来说很重要),转移了我们的注意力,使得我们向内认知它的安全性,替代了帮助我们认知外面广阔世界 ...
NPD南京炮苑电子技术研究所----NPD治疗仪
NPD南京炮苑电子技术研究所有限公司: http://www.npd365.com/ 研发药物离子导入和中医定向透药技术. 南京炮苑玉古康2号NPD系列专用中医定向透药治疗仪腰颈椎疼痛贴 N ...
安装pip源
国内源地址: 豆瓣(douban) http://pypi.douban.com/simple/ 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 h ...
hosts文件配置及主要作用
hosts文件位于" C:\Windows\System32\drivers\etc "目录下,用于转换名字与IP地址的转换. 在浏览器中通过域名访问网站,首先查看hosts文件中 ...
DirectX游戏开发——从一个小游戏開始
本系列文章由birdlove1987编写,转载请注明出处. 文章链接: http://blog.csdn.net/zhurui_idea/article/details/26364129 写在前面:自 ...

（三）Lucene——Field域和索引的增删改

（三）Lucene——Field域和索引的增删改的更多相关文章

随机推荐

热门专题