lucene 结合数据库做搜索

package jdbc;

import java.sql.Connection;

import java.sql.DriverManager;

import java.sql.PreparedStatement;

import java.sql.SQLException;

import java.util.UUID;

public class ConnectionUtil {

    private static String driver="com.mysql.cj.jdbc.Driver";

    private static String url="jdbc:mysql://localhost:3306/solrdb?useUnicode=true&characterEncoding=UTF-8&useSSL=false&serverTimezone=UTC&rewriteBatchedStatements=true";

    private static String user="root";

    private static String password="123456";

    public static Connection getConn() {

        try {

            Class.forName(driver);

            Connection conn=DriverManager.getConnection(url, user, password);

            return conn;

        } catch (ClassNotFoundException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (SQLException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

        return null;

    }

    public void CreateData() {

        Connection conn=getConn();

        try {

        PreparedStatement ps=conn.prepareStatement

                ("insert into paper (id,name,title,author,content) values (?,?,?,?,?)");

        for(int i=0;i<100;i++) {

            ps.setString(1,UUID.randomUUID().toString());

            ps.setString(2,"专家233"+i);

            ps.setString(3,"杭州九次人大会议"+i);

            ps.setString(4,"记者");

            ps.setString(5, "北京时间2019-2-13日,杭州市举行了人大代表会议,会议决定现在...."+i);

            ps.executeUpdate();

        }

        System.out.println("执行完毕");

        } catch (SQLException e) {

            e.printStackTrace();

        }

    }

    public static void main(String[] args) {

        ConnectionUtil util=new ConnectionUtil();

        util.CreateData();

    }

}

//本类只为造数据

package jdbc;

import java.io.IOException;

import java.nio.file.Files;

import java.nio.file.Path;

import java.nio.file.Paths;

import java.sql.Connection;

import java.sql.PreparedStatement;

import java.sql.ResultSet;

import java.sql.SQLException;

import java.util.ArrayList;

import java.util.Date;

import java.util.List;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.document.FieldType;

import org.apache.lucene.index.IndexOptions;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.index.IndexWriterConfig.OpenMode;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

/**

 * Lucene 创建索引

 * @author moonxy

 *

 */

public class CreateIndexForMysql {

	public static List<Paper> CreateData() {

		Connection conn=ConnectionUtil.getConn();

		List<Paper>list=new ArrayList<Paper>();

		try {

		PreparedStatement ps=conn.prepareStatement

				("select * from paper ");

		ResultSet rs=ps.executeQuery();

		         //4.处理数据库的返回结果(使用ResultSet类)

		         while(rs.next()){

		            Paper paper=new Paper(rs.getString("id"),

		            		rs.getString("name"), rs.getString("title"),

		            		rs.getString("author"),rs.getString("content"));

		            list.add(paper);

		         }

		System.out.println("执行完毕");

		return list;

		} catch (SQLException e) {

			e.printStackTrace();

		}

		return null;

	}

    public static void main(String[] args) {

        // 创建3个News对象

        // 开始时间

        Date start = new Date();

        System.out.println("**********开始创建索引**********");

        // 创建IK分词器

        Analyzer analyzer = new StandardAnalyzer();

        IndexWriterConfig icw = new IndexWriterConfig(analyzer);

        // CREATE 表示先清空索引再重新创建

        icw.setOpenMode(OpenMode.CREATE);

        Directory dir = null;

        IndexWriter inWriter = null;

        // 存储索引的目录

        Path indexPath = Paths.get("indexdir");

        try {

            if (!Files.isReadable(indexPath)) {

                System.out.println("索引目录 '" + indexPath.toAbsolutePath() + "' 不存在或者不可读,请检查");

                System.exit(1);

            }

            dir = FSDirectory.open(indexPath);

            inWriter = new IndexWriter(dir, icw);

//自己设置字段索引类型

            // 设置ID索引并存储

            FieldType idType = new FieldType();

            idType.setIndexOptions(IndexOptions.DOCS);

            idType.setStored(true);

            // 设置标题索引文档、词项频率、位移信息和偏移量，存储并词条化

            FieldType titleType = new FieldType();

            titleType.setIndexOptions(IndexOptions.DOCS_AND_FREQS_AND_POSITIONS_AND_OFFSETS);

            titleType.setStored(true);

            titleType.setTokenized(true);

            FieldType contentType = new FieldType();

            contentType.setIndexOptions(IndexOptions.DOCS_AND_FREQS_AND_POSITIONS_AND_OFFSETS);

            contentType.setStored(true);

            contentType.setTokenized(true);

            contentType.setStoreTermVectors(true);

            contentType.setStoreTermVectorPositions(true);

            contentType.setStoreTermVectorOffsets(true);

            List<Paper>list=CreateData();

            for(int i=0;i<list.size();i++) {

            	 Document doc = new Document();

            	 doc.add(new Field("id", list.get(i).getId(), idType));

            	 doc.add(new Field("title", list.get(i).getTitle(), titleType));

            	 inWriter.addDocument(doc);

            }

//

//            doc1.add(new Field("id", String.valueOf(news1.getId()), idType));

//            doc1.add(new Field("title", news1.getTitle(), titleType));

//            doc1.add(new Field("content", news1.getContent(), contentType));

//            doc1.add(new IntPoint("reply", news1.getReply()));

//            doc1.add(new StoredField("reply_display", news1.getReply()));

//

//            Document doc2 = new Document();

//            doc2.add(new Field("id", String.valueOf(news2.getId()), idType));

//            doc2.add(new Field("title", news2.getTitle(), titleType));

//            doc2.add(new Field("content", news2.getContent(), contentType));

//            doc2.add(new IntPoint("reply", news2.getReply()));

//            doc2.add(new StoredField("reply_display", news2.getReply()));

//

//            Document doc3 = new Document();

//            doc3.add(new Field("id", String.valueOf(news3.getId()), idType));

//            doc3.add(new Field("title", news3.getTitle(), titleType));

//            doc3.add(new Field("content", news3.getContent(), contentType));

//            doc3.add(new IntPoint("reply", news3.getReply()));

//            doc3.add(new StoredField("reply_display", news3.getReply()));

//            inWriter.addDocument(doc1);

//            inWriter.addDocument(doc2);

//            inWriter.addDocument(doc3);

            inWriter.commit();

            inWriter.close();

            dir.close();

        } catch (IOException e) {

            e.printStackTrace();

        }

        Date end = new Date();

        System.out.println("索引文档用时:" + (end.getTime() - start.getTime()) + " milliseconds");

        System.out.println("**********索引创建完成**********");

    }

}

　　//以上为构建索引代码

///查询代码

package query;

import java.io.IOException;

import java.nio.file.Path;

import java.nio.file.Paths;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.DirectoryReader;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.queryparser.classic.ParseException;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.queryparser.classic.QueryParser.Operator;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

/**

 * 单域搜索

 * @author moonxy

 *

 */

public class QueryParseTest {

    public static void main(String[] args) throws ParseException, IOException {

        // 搜索单个字段

        String field = "title";

        // 搜索多个字段时使用数组

        //String[] fields = { "title", "content" };

        Path indexPath = Paths.get("indexdir");

        Directory dir = FSDirectory.open(indexPath);

        IndexReader reader = DirectoryReader.open(dir);

        IndexSearcher searcher = new IndexSearcher(reader);

        Analyzer analyzer = new StandardAnalyzer();//最细粒度分词

        QueryParser parser = new QueryParser(field, analyzer);

        // 多域搜索

        //MultiFieldQueryParser multiParser = new MultiFieldQueryParser(fields, analyzer);

        // 关键字同时成立使用 AND, 默认是 OR

        parser.setDefaultOperator(Operator.AND);

        // 查询语句

    //    Query query = parser.parse("农村学生");//查询关键词

        Query query = parser.parse("次人");//查询关键词

        System.out.println("Query:" + query.toString());

        // 返回前10条

        TopDocs tds = searcher.search(query, 100);

        for (ScoreDoc sd : tds.scoreDocs) {

            // Explanation explanation = searcher.explain(query, sd.doc);

            // System.out.println("explain:" + explanation + "\n");

            Document doc = searcher.doc(sd.doc);

           // System.out.println("DocID:" + sd.doc);

           // System.out.println("id:" + doc.get("id"));

            System.out.println("title:" + doc.get("title"));

         //   System.out.println("content:" + doc.get("content"));

          //  System.out.println("文档评分:" + sd.score);

        }

        dir.close();

        reader.close();

    }

}

注意我用的是MySQL 8.0 其他版本的自行更改对应的driverClass url

lucene 结合数据库做搜索的更多相关文章

Lucene.net站内搜索—6、站内搜索第二版
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
Lucene.net站内搜索—4、搜索引擎第一版技术储备（简单介绍Log4Net、生产者消费者模式）
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
Lucene.net站内搜索—3、最简单搜索引擎代码
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
Lucene.net站内搜索—2、Lucene.Net简介和分词
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
Lucene.net站内搜索—1、SEO优化
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
使用Lucene.net提升网站搜索速度整合记录
1.随着网站数据量达到500万条的时候,发现SQL数据库如果使用LIKE语句来查询,总是占用CPU很忙,不管怎么优化,速度还是上不来; 2.经过网上收集资料,HUBBLE.net目前虽然做得不错,但需 ...
Lucene5.5.4入门以及基于Lucene实现博客搜索功能
前言一直以来个人博客的搜索功能很蹩脚,只是自己简单用数据库的like %keyword%来实现的,所以导致经常搜不到想要找的内容,而且高亮显示.摘要截取等也不好实现,所以决定采用Lucene改写博客 ...
Lucene.net站内搜索—5、搜索引擎第一版实现
目录 Lucene.net站内搜索—1.SEO优化 Lucene.net站内搜索—2.Lucene.Net简介和分词Lucene.net站内搜索—3.最简单搜索引擎代码Lucene.net站内搜索—4 ...
Lucene.Net 站内搜索
Lucene.Net 站内搜索一全文检索: like查询是全表扫描(为性能杀手)Lucene.Net搜索引擎,开源,而sql搜索引擎是收费的Lucene.Net只是一个全文检索开发包(只是帮我们 ...

随机推荐

安装kafka过程及出现的问题解决
第一步:下载kafka安装包下载地址:http://kafka.apache.org/downloads 解压到/usr/local 目录 tar -zxvf kafka_2.12-2.2.0 第 ...
wqy的easy
题解不再赘述,\(wqy\) 写的很详细了,记点细节. \(A:\) \(n+1\) 位置也要差分一下,否则无法保证正确性. \(B:\) 贪心喜提二十分...充分考虑时间和\(std\)复杂度的关系 ...
软件工程---作业(one)
(1) 回顾你过去将近3年的学习经历 1.1 有序列表项一当初你报考的时候,是真正喜欢计算机这个专业吗? 自己填写来着,对这个专业也不是特别了解:导致后续学习很差 1.2 有序列表项二你现在后悔选择了 ...
Spring框架xml配置中属性ref与value的区别
1.spring批量扫描mybatis的mapper,使用value 2.spring管理mybatis的单个mapper,用的是ref 虽然引用的是同一个bean,但两个对象的属相类型明显不一样,一 ...
mycat+mysql集群:实现读写分离，分库分表
1.mycat文档:https://github.com/MyCATApache/Mycat-doc 官方网站:http://www.mycat.org.cn/ 2.mycat的优点: 配 ...
JsonIgnore注解不起作用的解决办法
一开始在属性上注解了JsonIgnore以为就不会序列化了,结果还是有这个属性,看来是没有起作用啊 [JsonIgnore] public List<int> SubjectAndSubS ...
[原创]X-HDL 4.2安装与使用
由于涉及到VHDL工程,但实际工作中,用Verilog更多些,因此安装X-HDL进行转换,安装步骤与使用如下: X-HDL进行破解,破解如下: 安装完毕后,打开一个带转换的文件,进行如下操作: 链接: ...
kafka单节点的安装，部署，使用
1.kafka官网:http://kafka.apache.org/downloads jdk:https://www.oracle.com/technetwork/java/javase/downl ...
Selenium自动化测试之元素定位
步骤: 1.通过前端工具,查看元素的属性 2.通过属性定位 iddriver.findElement(By.id("kw")) namedriver.findElement(By. ...
搭建 eclipse，maven，tomcat 环境
1,安装jdk 2,安装eclipse,可以写java程序 3,安装tomcat,可以写简单的web页面 4,安装maven,再eclipse中可以构建maven管理的java程序 5,将maven程 ...

lucene 结合数据库做搜索

lucene 结合数据库做搜索的更多相关文章

随机推荐

热门专题