第五步：Lucene创建索引

package cn.lucene;

import java.io.IOException;

import java.nio.file.Paths;

import java.util.Date;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field.Store;

import org.apache.lucene.document.NumericDocValuesField;

import org.apache.lucene.document.StringField;

import org.apache.lucene.document.TextField;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

public class First {

	public static void main(String[] args) throws IOException {

		long startTime = new Date().getTime();

		/*

		 * Analyzer：建立索引时使用的分析器 主要子类有StandardAnalyzer（一个汉字一个词）

		 * 还可以由第三方提供如开源社区提供一些中文分词器

		 */

		Analyzer analyzer = new StandardAnalyzer();

		/*

		 * Directory：代表索引文档的存储位置 这是一个抽象类有FSDirectory和RAMDirectory两个主要子类

		 * 前者将索引写入文件系统，后者将索引文档写入内存

		 */

		Directory dir = FSDirectory.open(Paths.get("E:\\LuceneIndex"));

		// 操作索引库的配置信息

		IndexWriterConfig iwc = new IndexWriterConfig(analyzer);

		// 建立索引的核心类，用来操作索引（增、删、改）

		IndexWriter iw = new IndexWriter(dir, iwc);

		addDoc(iw, "1", "libiao1", "张三是中国人1",20160101);

		addDoc(iw, "2", "libiao2", "李四是美国人2",20160102);

		addDoc(iw, "3", "libiao3", "王五是中国人3",20160103);

		addDoc(iw, "4", "libiao4", "马六是俄国人4",20160104);

		addDoc(iw, "5", "libiao5", "赵七是中国人5",20160105);

		addDoc(iw, "6", "qqqq", "苏八是中国人5",20160106);

		addDoc(iw, "7", "bbbb", "我是中国人5",20160107);

		iw.close();

		long endTime = new Date().getTime();

		System.out.println((endTime - startTime) + "s");

	}

	private static void addDoc(IndexWriter iw, String id, String name, String title, Integer dt) throws IOException {

		Document doc = new Document();

		/*

		 * @NumericDocValuesField:存储long类型。日期与时间也可以转换为数字类型存储与筛选

		 *

		 * @DoubleDocValuesField:存储double类型

		 *

		 * @StringField:构造函数。内部调用setTokenized(false)设置不分词。一般用于国家名、作者名、id等

		 *

		 * @TextField:构造函数。内部调用setTokenized(true)实现分词。一般用于文档正文

		 */

		doc.add(new StringField("id", id,Store.YES));

		doc.add(new StringField("name", name, Store.YES));

		doc.add(new TextField("title", title, Store.YES));

		doc.add(new StringField("dt", dt.toString(),Store.YES));//用于查询的属性

		doc.add(new NumericDocValuesField("dt", dt));//用于排序的属性

		iw.addDocument(doc);

	}

}

第五步：Lucene创建索引的更多相关文章

lucene创建索引的几种方式(一)
什么是索引: 根据你输入的值去找,这个值就是索引第一种创建索引的方式: 根据文件来生成索引,如后缀为.txt等的文件步骤: 第一步:FSDirectory.open(Paths.get(url)) ...
lucene创建索引简单示例
利用空闲时间写了一个使用lucene创建索引简单示例, 1.使用maven创建的项目 2.需要用到的jar如下: 废话不多说,直接贴代码如下: 1.创建索引的类(HelloLucene): packa ...
Lucene创建索引和索引的基本检索(Lucene 之 Hello World)
Author: 百知教育 gaozhy 注:演示代码所使用jar包版本为 lucene-xxx-5.2.0.jar 一.lucene索引操作 1.创建索引代码 try { // 1. 指定索引文件存 ...
Lucene创建索引流程
1.创建索引流程原始文档:互联网上的网页(爬虫或蜘蛛).数据库中的数据.磁盘上的文件创建文档对象(非结构化数据) 文档对象中的属性不叫属性现在成为域. 每个 Document 可以有多个 Fiel ...
搜索引擎学习（二）Lucene创建索引
PS:需要用到的jar包: 代码实现 1.工程结构 2.设置工程依赖的jar包 3.代码实现 /** * Lucene入门 * 创建索引 */ public class CreateIndex { / ...
lucene创建索引
创建索引. 1.lucene下载. 下载地址:http://archive.apache.org/dist/lucene/java/. lucene不同版本之间有不小的差别,这里下载的是lucene ...
搜索引擎学习（五）Lucene操作索引
一.代码分析 /** * Lucene入门 * 操作索引 */ public class ManageIndex { public IndexWriter getIndexWriter() throw ...
HTML5离线Web应用实战：五步创建成功
[IT168 技术]HTML5近十年来发展得如火如荼,在HTML 5平台上,视频,音频,图象,动画,以及同电脑的交互都被标准化.HTML功能越来越丰富,支持图片上传拖拽.支持localstorage. ...
Lucene系列五：Lucene索引详解（IndexWriter详解、Document详解、索引更新）
一.IndexWriter详解问题1:索引创建过程完成什么事? 分词.存储到反向索引中 1. 回顾Lucene架构图: 介绍我们编写的应用程序要完成数据的收集,再将数据以document的形式用lu ...

随机推荐

TopCoder SRM 710 Div2 Hard MinMaxMax Floyd最短路变形
题意: 有一个无向连通图,没有重边没有自环,并给出顶点的权值和边的权值定义一条路径\(difficulty\)值为该路径上最大的点权乘上最大的边权定义函数\(d(i,j)\)为\(i,j\)之间的 ...
laravel5.5事件广播系统
目录 1. 定义广播事件 1.1 广播名称 1.2 广播数据 1.3 广播队列 1.4 广播条件 2. 频道授权 2.1 定义授权路由 2.2 定义授权回调 3. 对事件进行广播 3.1 可以使用ev ...
剑指Offer - 九度1389 - 变态跳台阶
剑指Offer - 九度1389 - 变态跳台阶2013-11-24 04:20 题目描述: 一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级.求该青蛙跳上一个n级的台阶总共有多少种跳 ...
《Cracking the Coding Interview》——第11章：排序和搜索——题目3
2014-03-21 20:55 题目:给定一个旋转过的升序排序好的数组,不知道旋转了几位.找出其中是否存在某一个值. 解法1:如果数组的元素都不重复,那么我的解法是先找出旋转的偏移量,然后进行带偏移 ...
《Cracking the Coding Interview》——第9章：递归和动态规划——题目5
2014-03-20 03:23 题目:给定一个字符串,输出其全排列. 解法:可以调用STL提供的next_permutation(),也可以自己写一个.对于这种看起来简单的题目,应该在能优化的地方, ...
USACO Section2.2 Runaround Numbers 解题报告【icedream61】
runround解题报告---------------------------------------------------------------------------------------- ...
python学习笔记三：函数及变量作用域
一.定义 def functionName([arg1,arg2,...]): code 二.示例 #!/usr/bin/python #coding:utf8 #coding=utf8 #encod ...
去掉referer信息
<iframe src="auto-refresh.html" width=500 height=500 rel="noreferrer">< ...
mongo数据库启动报错
报错信息如下: [root@166 bin]# mongoMongoDB shell version v3.4.6-22-ga109a23connecting to: mongodb://127.0. ...
springboot10 framwork
一.Spring介绍 Spring 是位于业务逻辑层的框架. 优点很多(无缝对接前后层的框架.提供AOP的支持 , 和以前的 Sstruts . Hibernate 组合成了一套框架组合 SSH .现 ...

第五步：Lucene创建索引

第五步：Lucene创建索引的更多相关文章

随机推荐

热门专题