【Lucene3.6.2入门系列】第15节_SolrJ高亮
package com.jadyer.solrj; import java.util.ArrayList;
import java.util.List;
import java.util.Map; import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServer;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.impl.HttpSolrServer;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.common.SolrDocument;
import org.apache.solr.common.SolrInputDocument; /**
* 【Lucene3.6.2入门系列】第15节_SolrJ高亮
* @create Aug 20, 2013 1:50:38 PM
* @author 玄玉<http://blog.csdn.net/jadyer>
*/
public enum HelloSolrJHighLighter {
INSTANCE; private SolrServer server; private HelloSolrJHighLighter(){
//创建SolrServer对象,它有两个线程安全的子类EmbeddedSolrServer和CommonsHttpSolrServer
//EmbeddedSolrServer-----内嵌式的,不需要启动Web服务器
//CommonsHttpSolrServer--需要启动Web服务器,它是通过HTTP请求来获取数据的
//CommonsHttpSolrServer已不推荐直接使用了,而是推荐使用HttpSolrServer类
//同样的StreamingUpdateSolrServer也不推荐使用了,推荐使用ConcurrentUpdateSolrServer
server = new HttpSolrServer("http://127.0.0.1:8088/solr");
//添加索引
this.addIndex();
} /**
* 添加索引
* @see 这里之所以没有硬编码指定my_title和my_content的中文分词器
* @see 是由于schema.xml中在定义这俩<field>时已通过type属性指定了中文分词器
* @see 关于指定中文分词器的具体方法,详见http://blog.csdn.net/jadyer/article/details/10106011
*/
private void addIndex(){
try {
//添加之前先删除全部索引,删除完记得commit才能生效
server.deleteByQuery("*:*");
server.commit();
} catch (Exception e) {
e.printStackTrace();
}
List<SolrInputDocument> docs = new ArrayList<SolrInputDocument>();
for(int i=1; i<4; i++){
SolrInputDocument doc = new SolrInputDocument();
//对于Solr而言,默认的id是唯一的主键(如果我们没有自定义主键的话),当多次添加的时候,最后添加的相同id的域会覆盖已有的
doc.addField("id", Integer.toString(i));
//这里使用的是自定义的Field,所以就需要在schema.xml中为其添加<field>描述,并通过type属性指定其使用的分词器
doc.addField("my_title", "这是我的第" + i + "个SolrJ程序");
doc.addField("my_content", "my第" + i + "个SolrJ程序的运行情况");
docs.add(doc);
}
try {
//可以只添加一个Document,也可以一次添加多个Document,这里添加多个
server.add(docs);
//commit后方能生效,否则搜索到的还是add前的索引信息
server.commit();
} catch (Exception e) {
e.printStackTrace();
}
} /**
* 搜索高亮
*/
public void testHighLighter(){
SolrQuery query = new SolrQuery("my_title:SolrJ");
query.setHighlight(true).setHighlightSimplePre("<span style='color:red'>").setHighlightSimplePost("</span>");
//设置高亮的区域,可设置多个区域(但有个前提-->待高亮的信息必须是被存储的,即schema.xml中配置<field store="true">)
query.setParam("hl.fl", "my_title, my_content");
QueryResponse resp = null;
try {
resp = server.query(query);
} catch (SolrServerException e) {
e.printStackTrace();
}
for(SolrDocument sd : resp.getResults()){
Map<String, List<String>> snippetMap = resp.getHighlighting().get(sd.getFieldValue("id"));
if(snippetMap!=null && !snippetMap.isEmpty()){
List<String> snippetList = snippetMap.get("my_title");
for(String snippet : snippetList){
System.out.print(snippet);
}
System.out.print(" ");
//注意,如果在配置<field my_content multiValued="true"/>时指定其支持多值域
//那么,此处获取到的就会是第一个值域的值
snippetList = snippetMap.get("my_content");
for(String snippet : snippetList){
System.out.println(snippet);
}
}
}
} /**
* 测试一下SolrJ的高亮效果
* @see 测试前记得启动Web服务器
* @see 关于Solr与Tomcat的整合,详见http://blog.csdn.net/jadyer/article/details/10104077
*/
public static void main(String[] args) {
HelloSolrJHighLighter.INSTANCE.testHighLighter();
}
}
【Lucene3.6.2入门系列】第15节_SolrJ高亮的更多相关文章
- 【Lucene3.6.2入门系列】第05节_自定义停用词分词器和同义词分词器
首先是用于显示分词信息的HelloCustomAnalyzer.java package com.jadyer.lucene; import java.io.IOException; import j ...
- 【Lucene3.6.2入门系列】第04节_中文分词器
package com.jadyer.lucene; import java.io.IOException; import java.io.StringReader; import org.apach ...
- 【Lucene3.6.2入门系列】第03节_简述Lucene中常见的搜索功能
package com.jadyer.lucene; import java.io.File; import java.io.IOException; import java.text.SimpleD ...
- 【Lucene3.6.2入门系列】第14节_SolrJ操作索引和搜索文档以及整合中文分词
package com.jadyer.solrj; import java.util.ArrayList; import java.util.List; import org.apache.solr. ...
- 【Lucene3.6.2入门系列】第10节_Tika
首先贴出来的是演示了借助Tika创建索引的HelloTikaIndex.java PS:关于Tika的介绍及用法,详见下方的HelloTika.java package com.jadyer.luce ...
- ABP入门系列(15)——创建微信公众号模块
ABP入门系列目录--学习Abp框架之实操演练 源码路径:Github-LearningMpaAbp 1. 引言 现在的互联网已不在仅仅局限于网页应用,IOS.Android.平板.智能家居等平台正如 ...
- Vue 2.0 入门系列(15)学习 Vue.js 需要掌握的 es6 (2)
类与模块 类 es6 之前,通常使用构造函数来创建对象 // 构造函数 User function User(username, email) { this.username = username; ...
- ABP入门系列目录——学习Abp框架之实操演练
ABP是"ASP.NET Boilerplate Project (ASP.NET样板项目)"的简称. ASP.NET Boilerplate是一个用最佳实践和流行技术开发现代WE ...
- 【168】ENVI入门系列
参考:ENVI-IDL中国的博客 [ENVI入门系列]01.ENVI产品简介与入门 [ENVI入门系列]02.自定义坐标系(北京54.西安80.2000坐标系) [ENVI入门系列]03.基于自带定位 ...
随机推荐
- 转: angularjs 指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效
angular的坑很多 例子: 在directive的link中有一个$http请求,当请求完成后根据返回的值动态做element.append('......');这个操作, 能显示没问题,可问题是 ...
- php文件锁(转)
bool flock ( int handle, int operation [, int &wouldblock] );flock() 操作的 handle 必须是一个已经打开的文件指针.o ...
- 理解MySQL——索引与优化(转)
写 在前面:索引对查询的速度有着至关重要的影响,理解索引也是进行数据库性能调优的起点.考虑如下情况,假设数据库中一个表有10^6条记录,DBMS的页 面大小为4K,并存储100条记录.如果没有索引,查 ...
- iOS: 学习笔记, 用代码驱动自动布局实例
iOS自动布局是设置iOS界面的利器. 本实例展示了如何使用自动布局语言设置水平布局, 垂直布局 1. 创建空白iOS项目 2. 添加一个控制器类, 修改YYAppDelegate.m文件 #impo ...
- 练习2 G题 - 数值统计
Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Description 统计给 ...
- mongodb常用命令【转】
mongodb由 C++编写,其名字来自humongous这个单词的中间部分,从名字可见其野心所在就是海量数据的处理.关于它的一个最简洁描述为:scalable, high-performance, ...
- PC和单片机通过MODBUS RTU通信
最近研究了一下MODBUS通信,在STC12C5A60S2单片机上实现了MODBUS协议的部分功能,方便上位机从单片机系统上获取数据,比如由单片机获取的温度.湿度.或者控制信号的状态等.有了MODBU ...
- em(倍)与px的区别(转载)
在国内网站中,包括三大门户,以及"引领"中国网站设计潮流的蓝色理想,ChinaUI等都是使用了px作为字体单位.只有百度好歹做了个可调的表率.而 在大洋彼岸,几乎所有的主流站点都使 ...
- bzoj 1031: [JSOI2007]字符加密Cipher 後綴數組模板題
1031: [JSOI2007]字符加密Cipher Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 3157 Solved: 1233[Submit ...
- tyvj P1135 - 植物大战僵尸 最大权闭合图
P1135 - 植物大战僵尸 From ytt Normal (OI)总时限:10s 内存限制:128MB 代码长度限制:64KB 背景 Background 虽然这么多天了,,虽然 ...