总算搞明白 lucene 中关于Store.YES  关于Store.NO的解释了

一直对Lucene Store.YES不太理解,网上多数的说法是存储字段,NO为不存储。

这样的解释有点郁闷:字面意思一看就明白,但是不解。

之前我的理解是:如果字段可以不存储,那要怎么搜索这个不存储的字段呢?

原来Lucene就是这样,可以设置某些字段为不存储,但是可以用来检索。

终于在一篇文章里看到这几句话,突然间就明白了。

  1. //Store.YES 保存 可以查询 可以打印内容
  2. Field storeYes = new Field("storeyes","storeyes",Store.YES,Index.TOKENIZED);
  3. //Store.NO 不保存 可以查询 不可打印内容 由于不保存内容所以节省空间,但是这个索引是存在的,可以通过这个索引去检索
  4. Field storeNo = new Field("storeno","storeno",Store.NO,Index.TOKENIZED);
  5. //Store.COMPRESS 压缩保存 可以查询 可以打印内容 可以节省生成索引文件的空间,Field storeCompress = new Field("storecompress","storecompress",Store.COMPRESS,Index.TOKENIZED);

至此,对于理解Store.YES,Store.NO 就是不存储就不能直接获取此字段的内容,存储了就可以。但是两者都可以用于检索。

字段是否能被搜索,还与Index有关。

package luxun.lucene.base;

import java.io.File;
import java.io.IOException;
import java.util.Arrays;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Index;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.FieldDoc;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.SortField;
import org.apache.lucene.search.SortField.Type;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopFieldDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.LockObtainFailedException;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;
public class SortFieldValueTest {
    
    @SuppressWarnings("deprecation")
    public  void buildIndex() throws CorruptIndexException, LockObtainFailedException, IOException {
        File indexDir = new File("/home/cristo/luxun_test/luxunlucenetest/04/index");
        // dataDir is the directory that hosts the text files that to be indexed
        Directory directory = new SimpleFSDirectory(indexDir);
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);
        IndexWriter writer = new IndexWriter(directory,     new IndexWriterConfig(Version.LUCENE_47, analyzer));
        Document doc = new Document();
        doc.add(new Field("id", "1", Store.YES, Index.NO));
        doc.add(new Field("text", "lucene", Store.NO, Index.ANALYZED));
        doc.add(new Field("time", "2010", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        doc.add(new Field("tide", "149", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        writer.addDocument(doc);
        doc = new Document();
        doc.add(new Field("id", "3", Store.YES, Index.NO));
        doc.add(new Field("text", "lucene", Store.NO, Index.ANALYZED));
        doc.add(new Field("time", "2011", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        doc.add(new Field("tide", "14", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        writer.addDocument(doc);
        doc = new Document();
        doc.add(new Field("id", "2", Store.YES, Index.NO));
        doc.add(new Field("text", "lucene", Store.NO, Index.ANALYZED));
        doc.add(new Field("time", "2001", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        doc.add(new Field("tide", "13", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        writer.addDocument(doc);
        doc = new Document();
        doc.add(new Field("id", "5", Store.YES, Index.NO));
        doc.add(new Field("text", "lucene", Store.NO, Index.ANALYZED));
        doc.add(new Field("time", "2001", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        doc.add(new Field("tide", "19", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        writer.addDocument(doc);
        doc = new Document();
        doc.add(new Field("id", "9", Store.YES, Index.NO));
        doc.add(new Field("text", "lucene", Store.NO, Index.ANALYZED));
        doc.add(new Field("time", "2171", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        doc.add(new Field("tide", "19", Store.NO, Index.NOT_ANALYZED_NO_NORMS));
        writer.addDocument(doc);
        writer.commit();
        writer.close();
    }
    public  void searchWithOneSortField() throws CorruptIndexException, IOException {//可以通过对time属性进行索引,排序,获取对应的id
        File indexDir = new File("/home/cristo/luxun_test/luxunlucenetest/04/index");
        @SuppressWarnings("deprecation")
        IndexSearcher searcher = new IndexSearcher(IndexReader.open(FSDirectory.open( indexDir)));
        TermQuery termQuery = new TermQuery(new Term("time", "2001"));
        TopFieldDocs topFieldDocs = searcher.search(termQuery, null, 10, new Sort(new SortField("time",Type.STRING, true)));
        ScoreDoc[] sorDocs = topFieldDocs.scoreDocs;
        for (ScoreDoc doc : sorDocs) {
        //    FieldDoc fieldDoc = (FieldDoc) doc;
            System.out.println(searcher.doc(doc.doc).get("id"));
        }
    }
  
    public static void main(String[] args) throws CorruptIndexException, IOException {
        SortFieldValueTest SortFieldValueTest1=new SortFieldValueTest();
        SortFieldValueTest1.buildIndex();
        SortFieldValueTest1.searchWithOneSortField();

}
}

参考http://blog.csdn.net/telnetor/article/details/6187378

http://www.codeweblog.com/%E6%80%BB%E7%AE%97%E6%89%BE%E5%88%B0lucene-%E5%85%B3%E4%BA%8Estore-yes%E7%9A%84%E8%A7%A3%E9%87%8A%E4%BA%86/

lucene 中关于Store.YES 关于Store.NO的解释的更多相关文章

  1. SQL Server中TempDB管理(version store的逻辑结构)

    原文:SQL Server中TempDB管理(version store的逻辑结构) 原文来自: http://blogs.msdn.com/b/sqlserverstorageengine/arch ...

  2. vue-learning:41 - Vuex - 第二篇:const store = new Vue.Store(option)中option选项、store实例对象的属性和方法

    vuex 第二篇:const store = new Vue.Store(option)中option选项.store实例对象的属性和方法 import Vuex from 'vuex' const ...

  3. 【Lucene3.6.2入门系列】第03节_简述Lucene中常见的搜索功能

    package com.jadyer.lucene; import java.io.File; import java.io.IOException; import java.text.SimpleD ...

  4. Lucene 中自定义排序的实现

    使用Lucene来搜索内容,搜索结果的显示顺序当然是比较重要的.Lucene中Build-in的几个排序定义在大多数情况下是不适合我们使用的.要适合自己的应用程序的场景,就只能自定义排序功能,本节我们 ...

  5. lucene中的IndexWriter.setMaxFieldLength()

    lucene中的IndexWriter.setMaxFieldLength() 老版本的Lucene中,IndexWriter的maxFieldLength是指一个索引中的最大的Field个数. 这个 ...

  6. 《Lucene in Action 第二版》第4章节 学习总结 -- Lucene中的分析

    通过第四章的学习,可以了解lucene的分析过程是怎样的,并且可以学会如何使用lucene内置分析器,以及自定义分析器.下面是具体总结 1. 分析(Analysis)是什么? 在lucene中,分析就 ...

  7. lucene中Field简析

    http://blog.csdn.net/zhaoxiao2008/article/details/14180019 先看一段lucene3代码 Document doc = new Document ...

  8. lucene中TOKENIZED,UN_TOKENIZED 解釋

    Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED)); 這些地方與舊版本有很大的區別 ...

  9. Lucene中的 Query对象

    "Lucene中的 Query对象": 检 索前,需要对检索字符串进行分析,这是由queryparser来完成的.为了保证查询的正确性,最好用创建索引文件时同样的分析器. quer ...

随机推荐

  1. C# 语言规范_版本5.0 (第4章 类型)

    1. 类型 C# 语言的类型划分为两大类:值类型 (Value type) 和引用类型 (reference type).值类型和引用类型都可以为泛型类型 (generic type),泛型类型采用一 ...

  2. FZU 1893 内存管理 模拟

    比赛的时候队友要做这道题…… 他没做出来自己也被误导了…… 也算是个教训 自己还是要有自己的思路…… 又是模拟题…… 网上都是用vector做的 我最近才会stl 怎么会用那么高大上的的东西…… 强力 ...

  3. hdu 1408 盐水的故事

    Problem Description 挂盐水的时候,如果滴起来有规律,先是滴一滴,停一下:然后滴二滴,停一下:再滴三滴,停一下...,现在有一个问题:这瓶盐水一共有VUL毫升,每一滴是D毫升,每一滴 ...

  4. HDU1503:Advanced Fruits(LCS)

    Problem Description The company "21st Century Fruits" has specialized in creating new sort ...

  5. 抛弃阿里云,中国用户购买海外VPS的五个理由

    王掌柜在过去的五年多时间里,折腾过不少vps品牌,最开始玩的是一年一百多块钱的香港虚拟主机,后来业务量大了,开始折腾国内的小鸟云.阿里云.腾讯云.电信云.百度云主机,国外的linode\interse ...

  6. jQuery 属性操作 - attr() 方法

    定义和用法 attr() 方法设置或返回被选元素的属性值. 根据该方法不同的参数,其工作方式也有所差异. 实例1 设置被选元素的属性和值. <html><head><sc ...

  7. javascript 值传递

    在js中 简单类型是值传递 复杂类型是引用传递 简单类型:String Number Boolean undefined Null 复杂类型:Object 下面的代码演示这个 var simpleNa ...

  8. Pots(BFS)

    Pots Time Limit : 2000/1000ms (Java/Other)   Memory Limit : 131072/65536K (Java/Other) Total Submiss ...

  9. SQL 课程 连接查询

    今天,我主要是对前面所学习过的子查询进行了复习,然后学习了连接查询join on 的内容. 如: select renyuan.code,name,age ,sex , bumen.bname,bce ...

  10. tomcat下同时部署两个项目不能正常启动的问题

    在部署两个项目,这两个项目都是采用了一个框架,只是业务系统进行了修改.部署的时候发现启动有问题.会报类似下边的错误 Web app root system property already set t ...