初识SolrJ开发, schema.xml的配置与服务初始化.
schema.xml位于solr/collection1/conf/目录下,是Solr中用户定义字段类型及字段的配置文件.
Solr版本: 4.6.0
第一步: Schema.xml说明
实例schema.xml结构同solr/collection1/conf/schema.xml结构一致,具体配置通过注解已注明.
<?xml version="1.0" encoding="UTF-8" ?>
<schema name="example" version="1.5">
<fields> <!--field属性说明:
filed字段用于定义数据源字段所使用的搜索类型与相关设置.
name:数据源字段名,搜索使用到.
type:搜索类型名例如中文ika搜索名text_ika,对应于fieldType中的name.不需要分词的字符串类型,string即可,如果需要分词,types中配置好的分词type。
indexed:是否被索引,只有设置为true的字段才能进行搜索排序分片(earchable, sortable, facetable)。
stored:是否存储内容,如果不需要存储字段值,尽量设置为false以提高效率。
multiValued:是否为多值类型,SOLR允许配置多个数据源字段存储到一个搜索字段中。多个值必须为true,否则有可能抛出异常。
--> <field name="id" type="string" indexed="true" stored="true" required="true" />
<field name="name" type="text_ik" indexed="true" stored="true" multiValued="false"/>
<field name="phone" type="string" indexed="false" stored="true" />
<field name="email" type="string" indexed="false" stored="true" multiValued="true" />
<field name="city_id" type="int" indexed="true" stored="true" />
<field name="address" type="text_ik" index="true" stored="true" />
<field name="all" type="string" index="true" stored="true" /> <!-- 动态字段定义通过*来定义 -->
<dynamicField name="*_i" type="int" indexed="true" stored="true"/>
<dynamicField name="*_s" type="string" indexed="true" stored="true"/> </fields> <!--uniqueKey节点
设置主键,solr必须有一个主键,一般为id也可以自行定义.
这个字段决定和增强文档的唯一性
-->
<uniqueKey>id</uniqueKey> <!--defaultSearchField节点
默认搜索的字段,默认值为text,
如果我们已经将需要搜索的字段拷贝至all字段了,在这里设为all即可-->
<defaultSearchField>text</defaultSearchField> <!--solrQueryParser节点
默认搜索操作符参数,及搜索短语间的逻辑,用AND增加准确率,用OR增加覆盖面,建议用AND,也可在搜索语句中定义。
例如搜索"Java 多线程",使用AND默认搜索为"Java AND 多线程"-->
<solrQueryParser defaultOperator="OR"/> <!--copyField节点
如果我们的搜索需要搜索多个字段该怎么办呢?这时候,我们就可以使用copyField节点,
我们将所有的中文分词字段全部拷贝至all中,当我们进行全文检索是,只用搜索all字段就OK了.
-->
<copyField source="name" dest="all" />
<copyField source="phone" dest="all" />
<copyField source="email" dest="all" /> <types> <!--定义字段处理类型 -->
<fieldType name="int" class="solr.TrieIntField" precisionStep="0" omitNorms="true" positionIncrementGap="0" />
<fieldType name="float" class="solr.TrieFloatField" precisionStep="0" omitNorms="true" positionIncrementGap="0" />
<fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" omitNorms="true" positionIncrementGap="0" />
<fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true" />
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory" />
</analyzer>
</fieldType> <!-- 定义常规分词 类型-->
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100"> <!-- 建立索引时的分词器配置 -->
<analyzer type="index">
<!-- 建立索引时使用标准分词器 -->
<tokenizer class="solr.StandardTokenizerFactory"/>
<!-- 停用词过滤器, 用于索引文档中的停用词去掉 -->
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<!-- 大写转小写过滤器 -->
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer> <!-- 查询的时候使用的分词器 -->
<analyzer type="query">
<!-- 查询索引时使用标准分词器 -->
<tokenizer class="solr.StandardTokenizerFactory"/>
<!-- 停用词过滤器, 用于索引文档中的停用词去掉 -->
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<!-- 定义查询的时使用同义词过滤器 -->
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<!-- 大写转小写过滤器 -->
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer> </fieldType> <!--定义IK分词类型-->
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType> </types> </schema>
在默认的solr/collection1/conf/schema.xml文件中,有如下field设定,其中title配置为允许多个值,所以我们抽象类中可以用集合标示.
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="title" type="text_general" indexed="true" stored="true" multiValued="true"/>
<field name="author" type="text_general" indexed="true" stored="true"/>
第二步: 创建相应的抽象类
package com.test.model;
import java.io.Serializable;
import java.util.List;
import org.apache.commons.lang.builder.ToStringBuilder; public class Article implements Serializable{ /**
*
*/
private static final long serialVersionUID = 4017316764889231758L; private String id; private List<String> title; private String author; public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
} public String getAuthor() {
return author;
}
public void setAuthor(String author) {
this.author = author;
}
public List<String> getTitle() {
return title;
}
public void setTitle(List<String> title) {
this.title = title;
} @Override
public String toString() {
return ToStringBuilder.reflectionToString(this);
} }
第三步: 创建solr客户端
package com.plugin.solr.client; import java.util.Collections;
import java.util.HashMap;
import java.util.Map; import org.apache.solr.client.solrj.SolrServer;
import org.apache.solr.client.solrj.impl.HttpSolrServer;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory; public class SolrClient { private static final Logger LOG = LoggerFactory.getLogger(SolrClient.class); private static Map<String, SolrServer> solrServerMap = Collections.synchronizedMap(new HashMap<String, SolrServer>()); /**
* 获取HttpSolrServer
*
* @param SOLR_URL
*
* @return SolrServer
*/
public static SolrServer getHttpSolrServer(final String solrURL) {
SolrServer solrServer = null;
if (!solrServerMap.containsKey(solrURL)) {
try {
solrServer = new HttpSolrServer(solrURL);
if (solrServer != null) {
solrServerMap.put(solrURL, solrServer);
LOG.info("Load " + solrURL + " finish.");
}
} catch (Exception e) {
LOG.warn("sorlURL error ," + solrURL);
e.printStackTrace();
}
}
return solrServerMap.get(solrURL);
}
}
第四步: 编写客户端连接检测方法并测试
/**
* ping检测solr是否down掉 [测试通过]
* @param server
* @return
*/
public static String ping(SolrServer server){
try {
return server.ping().getResponse().toString();
} catch (SolrServerException e) {
LOG.error("Solr system ping error " + e.getMessage(), e);
} catch (IOException e) {
LOG.error("Solr system ping error " + e.getMessage(), e);
}
return null;
}
启动tomcat服务器(前提是solr与tomcat已集成),本地tomcat端口为8888,编写junit测试
package com.test.search; import java.util.ArrayList;
import java.util.List;
import java.util.UUID; import org.apache.solr.client.solrj.SolrServer;
import org.junit.Before;
import org.junit.Test; import com.plugin.page.Page;
import com.plugin.solr.client.SolrClient;
import com.plugin.solr.engine.SolrEngineHandler;
import com.test.model.Article; public class SolrTest { private SolrServer server; @Before
public void init(){
String solrURL = "http://localhost:8888/solr";
server = SolrClient.getHttpSolrServer(solrURL);
} @Test
public void pingSolr(){
System.out.println("ping solr result: " +SolrEngineHandler.ping(server));
}
}
运行结果
ping solr result: {responseHeader={status=0,QTime=656,params={df=text,echoParams=all,rows=10,echoParams=all,wt=javabin,version=2,q=solrpingquery,distrib=false}},status=OK}
连接成功.
转载请注明出处:[http://www.cnblogs.com/dennisit/p/3620597.html]
初识SolrJ开发, schema.xml的配置与服务初始化.的更多相关文章
- Mycat配置文件schema.xml参数配置
Mycat原理: Mycat的原理中最重要的一个动词是"拦截",它拦截了用户发送过来的SQL语句,首先对SQL语句做了一些特定的分析:如分片分析.路由分析.读写分离分析.缓存分析等 ...
- 分布式项目开发-spring-dao.xml基础配置
基础步骤: 1 数据源 2 sqlSessionFactory 3 MapperScan 打包. db.properties文件 db.username=root db.password=123456 ...
- solr5.5教程-schema.xml部分配置
本文章全部内容均翻译自solr自带的配置文件. 1.Field结点说明 name: 必须的,field的名字 type: 必须的,fieldType部分所定义的type的名字 index ...
- 分布式项目开发-web.xml基础配置
<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http:// ...
- 根据mysql数据库 定义solr Schema.xml中配置业务域
<!--product--> <field name="product_name" type="text_ik" indexed=" ...
- solr schema.xml文档节点配置
首先,讲解一下/usr/local/solr/collection1/conf/schema.xml的配置,此文档功能类似于配置索引数据库. Field:类似于数据库字段的属性(此文统一使用用“字段” ...
- solr的schema.xml配置属性解释
schema.xml做什么? SOLR加载数据,创建索引和数据时,核心数据结构的配置文件是schema.xml,该配置文件主要用于配置数据源,字段类型定义,搜索类型定义等.schema.xml的配置直 ...
- 数据库中间件DBLE学习(二) 学习配置schema.xml
前言 一边有一个经常引诱我让我"娱乐至死"的视频,还有一个不停"鞭策"我让我快点学习的大BOSS.正是有这两种极端的爱才让我常常在自信中明白自己努力的方向.嗯, ...
- Solr的学习使用之(二)schema.xml等配置文件的解析
上一篇文章已经讲解了如何部署Solr,部署是部署完了,可是总觉得心里空空的,没底,里面有N多配置文件,比如schema.xml.solrConfig.xml.solr.xml and so on……都 ...
随机推荐
- Sublime 格式化代码 设置快捷键以及插件使用
实在sublime中已经自建了格式化按钮: Edit -> Line -> Reindent 只是sublime并没有给他赋予快捷键,所以只需加上快捷键即可 Preference ...
- 数据驱动测试二:使用TestNG和CSV文件进行数据驱动
转载:https://blog.csdn.net/heart_1014/article/details/52013173 使用@DataProvider注解定义当前方法中的返回对象CSV文件(存放测试 ...
- Oracle——数据库启动与关闭
本文内容 服务器环境 客户端环境 概述 启动数据库 关闭数据库 补充 参考资料 本文说明 Oracle 数据库的启动和关闭,内容虽然基础,但是在数据库很多操作中都需要,因此,基础而重要,必须深入理解. ...
- vsphere storage appliance工作原理和实施
摘录自:http://www.07net01.com/storage_networking/VMwarexunihuazhiVSA_vSphere_Storage_Appliance_qunji_yi ...
- Linux中查看系统版本的方法
一.Linux系统中,XShell连接进去之后,查看系统版本的方法如下: 1.查找release文件 find /etc/ -name *-release 例如: 或者 2.查看release文件 c ...
- JAVA的堆于栈
1. 栈(stack)与堆(heap):都是Java用来在Ram中存放数据的地方.与C++不同,Java自动管理栈和堆,程序员不能直接地设置栈或堆. 2. 栈的优势:存取速度比堆要快,仅次于直接位于C ...
- 算法笔记_200:第三届蓝桥杯软件类决赛真题(C语言本科)
目录 1 星期几 2 数据压缩 3 拼音字母 4 DNA比对 5 方块填数 前言:以下代码部分仅供参考,若有不当之处,还望路过同学指出哦~ 1 星期几 1949年的国庆节(10月1日)是星期六. ...
- Semaphore的使用
Semaphore也是一个线程同步的辅助类,可以维护当前访问自身的线程个数,并提供了同步机制.使用Semaphore可以控制同时访问资源的线程个数,例如,实现一个文件允许的并发访问数. Semapho ...
- Oracle Data Integrator 12c-第一个映射
一.创建"项目" 设计器->项目,点击插入项目图标, 在项目对话框的"定义"标签下输入项目名称如ODI_Exercise ,保存 二.导入知识模块 项目→ ...
- 【翻译自mos文章】当/var/tmp文件夹被remove掉之后,GI crash,并启动失败,原因是ohasd can not create named pipe
来源于: GI crashes and fails to start after "/var/tmp" directory was removed as ohasd can not ...