【Lucene3.6.2入门系列】第15节

package com.jadyer.solrj;

import java.util.ArrayList;

import java.util.List;

import java.util.Map;

import org.apache.solr.client.solrj.SolrQuery;

import org.apache.solr.client.solrj.SolrServer;

import org.apache.solr.client.solrj.SolrServerException;

import org.apache.solr.client.solrj.impl.HttpSolrServer;

import org.apache.solr.client.solrj.response.QueryResponse;

import org.apache.solr.common.SolrDocument;

import org.apache.solr.common.SolrInputDocument;

/**

 * 【Lucene3.6.2入门系列】第15节_SolrJ高亮

 * @create Aug 20, 2013 1:50:38 PM

 * @author 玄玉<http://blog.csdn.net/jadyer>

 */

public enum HelloSolrJHighLighter {

	INSTANCE;

	private SolrServer server;

	private HelloSolrJHighLighter(){

		//创建SolrServer对象,它有两个线程安全的子类EmbeddedSolrServer和CommonsHttpSolrServer

		//EmbeddedSolrServer-----内嵌式的,不需要启动Web服务器

		//CommonsHttpSolrServer--需要启动Web服务器,它是通过HTTP请求来获取数据的

		//CommonsHttpSolrServer已不推荐直接使用了,而是推荐使用HttpSolrServer类

		//同样的StreamingUpdateSolrServer也不推荐使用了,推荐使用ConcurrentUpdateSolrServer

		server = new HttpSolrServer("http://127.0.0.1:8088/solr");

		//添加索引

		this.addIndex();

	}

	/**

	 * 添加索引

	 * @see 这里之所以没有硬编码指定my_title和my_content的中文分词器

	 * @see 是由于schema.xml中在定义这俩<field>时已通过type属性指定了中文分词器

	 * @see 关于指定中文分词器的具体方法,详见http://blog.csdn.net/jadyer/article/details/10106011

	 */

	private void addIndex(){

		try {

			//添加之前先删除全部索引,删除完记得commit才能生效

			server.deleteByQuery("*:*");

			server.commit();

		} catch (Exception e) {

			e.printStackTrace();

		}

		List<SolrInputDocument> docs = new ArrayList<SolrInputDocument>();

		for(int i=1; i<4; i++){

			SolrInputDocument doc = new SolrInputDocument();

			//对于Solr而言,默认的id是唯一的主键(如果我们没有自定义主键的话),当多次添加的时候,最后添加的相同id的域会覆盖已有的

			doc.addField("id", Integer.toString(i));

			//这里使用的是自定义的Field,所以就需要在schema.xml中为其添加<field>描述,并通过type属性指定其使用的分词器

			doc.addField("my_title", "这是我的第" + i + "个SolrJ程序");

			doc.addField("my_content", "my第" + i + "个SolrJ程序的运行情况");

			docs.add(doc);

		}

		try {

			//可以只添加一个Document,也可以一次添加多个Document,这里添加多个

			server.add(docs);

			//commit后方能生效,否则搜索到的还是add前的索引信息

			server.commit();

		} catch (Exception e) {

			e.printStackTrace();

		}

	}

	/**

	 * 搜索高亮

	 */

	public void testHighLighter(){

		SolrQuery query = new SolrQuery("my_title:SolrJ");

		query.setHighlight(true).setHighlightSimplePre("<span style='color:red'>").setHighlightSimplePost("</span>");

		//设置高亮的区域,可设置多个区域(但有个前提-->待高亮的信息必须是被存储的,即schema.xml中配置<field store="true">)

		query.setParam("hl.fl", "my_title, my_content");

		QueryResponse resp = null;

		try {

			resp = server.query(query);

		} catch (SolrServerException e) {

			e.printStackTrace();

		}

		for(SolrDocument sd : resp.getResults()){

			Map<String, List<String>> snippetMap = resp.getHighlighting().get(sd.getFieldValue("id"));

			if(snippetMap!=null && !snippetMap.isEmpty()){

				List<String> snippetList = snippetMap.get("my_title");

				for(String snippet : snippetList){

					System.out.print(snippet);

				}

				System.out.print("        ");

				//注意,如果在配置<field my_content multiValued="true"/>时指定其支持多值域

				//那么,此处获取到的就会是第一个值域的值

				snippetList = snippetMap.get("my_content");

				for(String snippet : snippetList){

					System.out.println(snippet);

				}

			}

		}

	}

	/**

	 * 测试一下SolrJ的高亮效果

	 * @see 测试前记得启动Web服务器

	 * @see 关于Solr与Tomcat的整合,详见http://blog.csdn.net/jadyer/article/details/10104077

	 */

	public static void main(String[] args) {

		HelloSolrJHighLighter.INSTANCE.testHighLighter();

	}

}

【Lucene3.6.2入门系列】第15节_SolrJ高亮的更多相关文章

【Lucene3.6.2入门系列】第05节_自定义停用词分词器和同义词分词器
首先是用于显示分词信息的HelloCustomAnalyzer.java package com.jadyer.lucene; import java.io.IOException; import j ...
【Lucene3.6.2入门系列】第04节_中文分词器
package com.jadyer.lucene; import java.io.IOException; import java.io.StringReader; import org.apach ...
【Lucene3.6.2入门系列】第03节_简述Lucene中常见的搜索功能
package com.jadyer.lucene; import java.io.File; import java.io.IOException; import java.text.SimpleD ...
【Lucene3.6.2入门系列】第14节_SolrJ操作索引和搜索文档以及整合中文分词
package com.jadyer.solrj; import java.util.ArrayList; import java.util.List; import org.apache.solr. ...
【Lucene3.6.2入门系列】第10节_Tika
首先贴出来的是演示了借助Tika创建索引的HelloTikaIndex.java PS:关于Tika的介绍及用法,详见下方的HelloTika.java package com.jadyer.luce ...
ABP入门系列（15）——创建微信公众号模块
ABP入门系列目录--学习Abp框架之实操演练源码路径:Github-LearningMpaAbp 1. 引言现在的互联网已不在仅仅局限于网页应用,IOS.Android.平板.智能家居等平台正如 ...
Vue 2.0 入门系列（15）学习 Vue.js 需要掌握的 es6 (2)
类与模块类 es6 之前,通常使用构造函数来创建对象 // 构造函数 User function User(username, email) { this.username = username; ...
ABP入门系列目录——学习Abp框架之实操演练
ABP是"ASP.NET Boilerplate Project (ASP.NET样板项目)"的简称. ASP.NET Boilerplate是一个用最佳实践和流行技术开发现代WE ...
【168】ENVI入门系列
参考:ENVI-IDL中国的博客 [ENVI入门系列]01.ENVI产品简介与入门 [ENVI入门系列]02.自定义坐标系(北京54.西安80.2000坐标系) [ENVI入门系列]03.基于自带定位 ...

随机推荐

[转]setTimeout() 函数未定义错误
用 setTimeout("showMe()",1000) 时出现 showMe is not defined 错误.这是由于showMe() 函数不在 setTimeout 调用 ...
100. Same Tree（C++）
100. Same Tree Given two binary trees, write a function to check if they are equal or not. Two binar ...
使用enable_shared_from_this示例
/*测试enable_shared_from_this*/ #include <iostream> #include <boost/smart_ptr/shared_ptr.hpp& ...
去掉Visual Studio 编辑器里中文注释的红色波浪线转载
我们通常用visual studio进行开发的时候,我们通常会用到一款比较流行比较方便的插件,那就是Visual Assist X,它可以增强Microsoft开发环境下的编辑能力,支持C/C++,C ...
JS操作SELECT方法
1.判断select选项中是否存在Value="paraValue"的Item2.向select选项中加入一个Item3.从select选项中删除一个Item4.修改sele ...
about python
函数式编程 λ演算 LISP,Erlang 尾递归栈的使用避免防御式编程 ER实体Entity关系relationship OOP [OOA/D] 属性.行为继承.聚合.关联抽象.封装笛卡尔 ...
css 多出一行或多行后显示...的方法
一行超出显示... .mui-ellipsis { overflow: hidden; white-space: nowrap; text-overflow: ellipsis; } 两行超出的显示. ...
Chrome控制台
先的简单介绍一下chrome的控制台,打开chrome浏览器,按f12就可以轻松的打开控制台大家可以看到控制台里面有一首诗还有其它信息,如果想清空控制台,可以点击左上角那个来清空,当然也可以通过在控 ...
ruby定时脚本
ruby定时脚本的实现涉及到三个方面: 要定时执行的代码定时控制(设置定时的时间) 将脚本后台化实例: # in func.rb def func # the function body goes ...
matlab的cell数组
matlab的cell数组元胞数组: 元胞数组是MATLAB的一种特殊数据类型,可以将元胞数组看做一种无所不包的通用矩阵,或者叫做广义矩阵.组成元胞数组的元素可以是任何一种数据类型的常数或者常量,每 ...

【Lucene3.6.2入门系列】第15节_SolrJ高亮

【Lucene3.6.2入门系列】第15节_SolrJ高亮的更多相关文章

随机推荐

热门专题