Solr4.4入门，介绍Solr的安装、IK分词器的配置及高亮查询结果(转)

一、Windows下安装solr-4.4.0

1、下载solr.4.4

2、下载绿色版tomcat6.0.18

3、解压下载的solr到d:\study\solr，将dist目录下的solr4.4.0.war包复制到tomcat的webapps下

4、在web.xml中配置solr.home为解压的 solr中的d:\study\solr\example\solr

<env-entry>

<env-entry-name>solr/home</env-entry-name>

<env-entry-value>D:\study\solr\solr-4.4.0\example\solr</env-entry-value>

<env-entry-type>java.lang.String</env-entry-type>

</env-entry>

如果不做此配置，在启动的时候将会报异常：

solr - org.apache.solr.common.SolrException: Could not load config for solrconfig.xml

5、启动tomcat,访问http://localhost:8080/solr-4.4.0即可访问

6、在左侧树中，选择collection1,会弹出节点菜单，其中documents功能表示往索引目录中添加记录，而Query可以查询指定目录。

7、往服务中添加索引

String url = "http://localhost:8080/solr-4.4.0";

SolrServer server = new HttpSolrServer(url);

SolrInputDocument doc1 = new SolrInputDocument();

doc1.addField("id", "1");

doc1.addField("title", "信息科技");

doc1.addField("content", "企业信息门户，元数据，数字沙盘，知识管理");

server.add(docs);

server.commit();

8、查询

public static void main(String[] args) {

String url = "http://localhost:8080/solr-4.4.0";

SolrServer server = new HttpSolrServer(url);

SolrQuery query = new SolrQuery("云南");

query.setFacetLimit(1);

//以下两个参数常用作分页时使用

query.setRows(1);// 设置每次取多少条

query.setStart(0);//设置从第几条开始查询

//以下几行设置查询结果关键字高亮显示

query.setHighlight(true);

// hl.fl参数表示哪个几Field关键字段高亮

query.setParam("hl.fl", "title, content");

query.setHighlightSimplePre("<font color=red>"); query.setHighlightSimplePost("</font"); query.setSort("name",ORDER.desc);

try {

QueryResponse response = server.query(query);

SolrDocumentList docs = response.getResults();

System.out.println("文档个数：" + docs.getNumFound());

System.out.println("查询时间：" + response.getQTime());

for (SolrDocument doc : docs) {

System.out.println("title: " + doc.getFieldValue("title"));

System.out.println("content : " + doc.getFieldValue("content "));

}

} catch (Exception e) {

e.printStackTrace();

}

二、在solr中配置IK中文分词器

在目录solr/example/solr/collection1/conf中的 secham.xml中types标签最后添加定义字段类型。

secham.xml文件是定义的类型以及存储的域。

</fieldType>

在field中指定字段类型为上面定义的

设置完比后重启服务

在admin管理台中，由于name是IK分词器，所以分词后的效果如下：

而title域是用的默认的分词器，即text_general，分词效果如下：

这说明IK分词器配置成功

Solr4.4入门，介绍Solr的安装、IK分词器的配置及高亮查询结果(转)的更多相关文章

solr添加中文IK分词器,以及配置自定义词库
Solr是一个基于Lucene的Java搜索引擎服务器.Solr 提供了层面搜索.命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式).它易于安装和配置,而且附带了一个基于H ...
Elasticsearch入门之从零开始安装ik分词器
起因需要在ES中使用聚合进行统计分析,但是聚合字段值为中文,ES的默认分词器对于中文支持非常不友好:会把完整的中文词语拆分为一系列独立的汉字进行聚合,显然这并不是我的初衷.我们来看个实例: POST ...
【ELK】【docker】【elasticsearch】1. 使用Docker和Elasticsearch+ kibana 5.6.9 搭建全文本搜索引擎应用集群,安装ik分词器
系列文章:[建议从第二章开始] [ELK][docker][elasticsearch]1. 使用Docker和Elasticsearch+ kibana 5.6.9 搭建全文本搜索引擎应用集群,安 ...
Solr4.10与tomcat整合并安装中文分词器
1.solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器.Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展,并对索引. ...
Linux下,非Docker启动Elasticsearch 6.3.0,安装ik分词器插件,以及使用Kibana测试Elasticsearch,
Linux下,非Docker启动Elasticsearch 6.3.0 查看java版本,需要1.8版本 java -version yum -y install java 创建用户,因为elasti ...
如何开发自己的搜索帝国之安装ik分词器
Elasticsearch默认提供的分词器,会把每个汉字分开,而不是我们想要的根据关键词来分词,我是中国人不能简单的分成一个个字,我们更希望 “中国人”,“中国”,“我”这样的分词,这样我们就需要 ...
Elasticsearch下安装ik分词器
安装ik分词器(必须安装maven) 上传相应jar包解压到相应目录 unzip elasticsearch-analysis-ik-master.zip(zip包) cp -r elasticse ...
Elastic Stack 笔记（二）Elasticsearch5.6 安装 IK 分词器和 Head 插件
博客地址:http://www.moonxy.com 一.前言 Elasticsearch 作为开源搜索引擎服务器,其核心功能在于索引和搜索数据.索引是把文档写入 Elasticsearch 的过程, ...
windows下elasticsearch安装ik分词器后无法启动
windows下elasticsearch安装ik分词器后启动报如下图错误: 然后百度说是elasticsearch路径有空格,一看果然我的路径有空格,然后重新换个路径就好了.

随机推荐

CSS3选择器01—CSS2.1部分选择器
这篇文章主要用于存储CSS以及CSS3的选择器部分知识,以便日后查阅及记忆. 该内容分为两部分,第一部分为css选择器的一些基本知识.第二部分为CSS3新增加的选择器. 在开始之前,先简单介绍一下选择 ...
Web服务器指纹识别工具httprint
Web服务器指纹识别工具httprint 在Web渗透测试中,准确判断服务器的类型直接影响后期渗透测试的成功率.Kali Linux提供了专门的Web服务器指纹识别工具Httprint.该工具根据 ...
ubuntu VNC中Xfce4中Tab键失效的解决方法
转:https://blog.csdn.net/xuezhisdc/article/details/48662435 说明在Ubuntu Server 14.04上安装了xfce4桌面环境,但是却发 ...
Atcoder Tenka1 Programmer Contest 2019 题解
link 题面真简洁 qaq C Stones 最终一定是连续一段 . 加上连续一段 # .直接枚举断点记录前缀和统计即可. #include<bits/stdc++.h> #define ...
【BZOJ-4184 】 Shallot 线段树按时间分治 + 线性基
4184: shallot Time Limit: 30 Sec Memory Limit: 128 MBSubmit: 356 Solved: 180[Submit][Status][Discu ...
Lua打印table树形结构
--这是quick中的工具,作用就是打印Lua中强大的table的结构, 当table的嵌套层级比较多的时候,这个工具非常方便,开发中必备的工具.--具体使用方法:local debug = requ ...
LPC-LINK 2 LPC4337 TQFP144 IO
IAR EWARM __iar_program_start, __iar_data_init3, __iar_copy_init3, __iar_zero_init3
#include <stdint.h> // The type of a pointer into the init table. typedef void const * table_p ...
TQ2440开发板存储器
TX2440A与TQ2440A开发板使用核心板完全相同有过51单片基础的同学应该都会看懂下图,先看下图,对实验板存储器分布有一个整体印象: s3c2440存储器概述: 1.S3C2440A的存储器管 ...
perl解析xml-XML::Simple/XMLin
转自: http://blog.charlee.li/perl-xml-simple/ [Perl]用XML::Simple解析XML文件在Perl中解析XML的方法最常见的就是使用 XML::DO ...

Solr4.4入门，介绍Solr的安装、IK分词器的配置及高亮查询结果(转)

Solr4.4入门，介绍Solr的安装、IK分词器的配置及高亮查询结果(转)的更多相关文章

随机推荐

热门专题