1.什么是solr

  solr是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文检索服务器。Solr提供了比lucene风味丰富的查询语言,同时实现了可配置,可扩展,并对索引,搜索性能进行优化。

  Solr可以独立运行,运行在Jetty,Tomcat等这些Servlet容器中,solr索引的实现方法很简单,用POST方法享Solr服务器发送一个藐视Field及其内容的XML文档,Solr根据XML文档添加,删除,更新索引。Solr搜索只需要发送HTTP GET请求,然后对Solr返回XML,json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能。Solr提供了一个管理界面,通过管理界面可以查询solr的配置和运行情况。

2.Solr与Lucene的区别

  Lucene是一个开放源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎。Lucene提供了完整的查询引擎和索引引擎,目的是为了软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者以Lucene为基础构建全文检索引擎。

  Solr的目标是打造一款企业级的搜索引擎系统,他是一个搜索引擎服务,可以独立运行,通过solr可以非常快速的构建企业的搜索引擎,通过solr也可以搞笑的完成站内搜索功能。

Solr原理图

3. Solr安装及配置

3.1 官网下载:https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr

3.2 solr4.10.3的目录结构

bin:solr的运行脚本

contrib:solr的一些贡献软件/插件,用于增强solr的功能

dist:该目录包含build过程汇总产生的war和jar文件,以及相关的依赖文件。

docs:solr的API文档

example:solr工程的例子目录:

  example/solr:

  该目录三十一个包含默认配置信息的solr的core目录

  example/muticore:

  该目录包含了在solr的multicore中设置的多个Core目录

  example/webapps:

  该目录中包括了一个solr.war,该war可作为solr的运行实例工程。

licenses:solr相关的一些许可信息

3.3.solr运行环境

solr需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上;solr默认提供jetty(java写的Servlet容器),在这使用tomcat作为servlet容器。

Solr整合tomcat

第一步:先将\solr\solr-4.10.3\example\webapps下的solr.war 复制粘贴到tomcat的webapps下,并解压删除。

第二步:再将solr-4.10.3\example\lib\ext文件夹下的所有jar包copy到第一步解压好的solr\WEB-INF\lib下

第三步:创建一个solrhome文件夹,将\solr-4.10.3\example\solr下的所有文件全部copy到solrhome文件夹下

第四步:修改tomcat中webapps下的webapps\solr\WEB-INF\web.xml

第五步:启动tomcat

效果:

4. schema.xml配置文件

在solrhome中的collection1的配置文件中有一个schema.xml文件,这是对域进行配置的xml文件。之前使用Lucene是new出来一个域对象,而在solr中是在schema.xml中进行配置。其中有域,动态域,复制域标签。

当搜索某个数据需要在两个域中进行搜索时,可以使用复制域,这样只需要发送一个请求,就可以在不同的域中进行搜索。因为使用copyField标签时,搜索的两个域会先保存到这两个域中,然后在转到一个text域进行合并保存,在搜索的时候就直接搜索text域。

 5. 中文分析器配置(IKAnalyzer)

要配置中文分词器,需要先了解schema.xml的配置。因为schema.xml已经配置了标准分词器

第一步:先将IKAnalyzer的jar包放入tomcat\webapps\solr\WEB-INF\lib

第二步:将分词器的配置文件放入tomcat\webapps\solr\WEB-INF\classes

第三步:在schema.xml中添加配置,如下

<!-- IKAnalyzer -->
<fieldType name="text_ik" class="solr.TextField" >
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType> <!-- IKAnalyzer Field -->
<field name="title_ik" type="text_ik" indexed="true" stored="true" />
<field name="content_ik" type="text_ik" indexed="true" stored="true" multiValued="true"/>

第四步:重启tomcat服务,打开solr后台

lucene&solr学习——solr学习(一)的更多相关文章

  1. Lucene/Solr企业级搜索学习资源

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过Http GSol ...

  2. 搞Solr这一年(本人QQ 282335345 群412268049 欢迎大家一起学习Solr 非诚勿扰)

    搞Solr这一年 去年6月份毕业到现在已经快一年半了,很庆幸从事了搜索引擎这份工作,虽然谈不上有多深入,但至少已经入门了.在这一年半里,搞了3个月的hbase和mapreduce,搞了一个月的nutc ...

  3. solr 从零学习开始

    2010-10 目 录 1 1.1 1.2 1.2.1 1.2.2 1.2.3 1.2.4 1.2.5 1.2.6 1.2.7 1.3 1.3.1 1.3.2 1.4 1.4.1 1.4.2 1.4. ...

  4. solr简介、学习详细过程!(超详细~)

    solr是什么呢? 一.Solr它是一种开放源码的.基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中. 二.Solr 提供了层面搜索(就是统计).命中醒目显示并且支持多种输出 ...

  5. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml)(3)

         5. <fieldType> fieldType主要定义了一些字段类型,其name属性值用于前面<field>中的type属性的值.e.g. <fieldTyp ...

  6. Solr 6.7学习笔记(04)-- Suggest

    当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现这一功能.配置如 ...

  7. SSM+solr 通过商品搜索学习solr的简单使用

    学习了一下https://github.com/TyCoding/ssm-redis-solr这个github上的solr搜索功能,现在来记录一下. 我的理解就是solr有点类似于数据库,但它是有索引 ...

  8. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) -- 样例(6)

    managed-schema 样例: <?xml version="1.0" encoding="UTF-8" ?> <!-- License ...

  9. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) - filter(5)

    自定义fieldType时,通常还会用到filter.filter必须跟在tokenizer或其它filter之后.如: <fieldType> <analyzer> < ...

  10. Solr学习笔记(1) —— Solr概述&Solr的安装

    一.概述 使用Solr实现电商网站中商品信息搜索功能,可以根据关键字.分类.价格搜索商品信息,也可以根据价格进行排序. 1.1 实现方法 在一些大型门户网站.电子商务网站等都需要站内搜索功能,使用传统 ...

随机推荐

  1. "Sorry this application cannot run under a virtual machine" Error

    错误: 运行一个程序是出现了 “sorry this application cannot run under a virtual machine” 错误. 如何解决: 控制面板-->卸载程序- ...

  2. python 批量ping服务器

    最近在https://pypi.python.org/pypi/mping/0.1.2找到了一个python包,可以用它来批量ping服务器,它是中国的大神写的,支持单个服务器.将服务器IP写在txt ...

  3. 【SoapUI】http接口测试

    一.接口介绍 API(Application Programming Interface,应用程序编程接口) 1.硬件接口 USB接口 硬盘接口 SD卡接口 LAN口和WAN口 CONSOLE口 .. ...

  4. Video标签事件与属性

    事件与属性 属性 描述 audioTracks 返回可用的音轨列表(MultipleTrackList对象) autoplay 媒体加载后自动播放 buffered 返回缓冲部件的时间范围(TimeR ...

  5. SQL Server Profiler(转载)

    SQL Server Profiler工具 一.SQL Profiler工具简介 SQL Profiler是一个图形界面和一组系统存储过程,其作用如下: 图形化监视SQL Server查询: 在后台收 ...

  6. C/C++中的auto关键词

    C语言 auto被解释为一个自动存储变量的关键字,也就是申明一块临时的变量内存. 例如: auto double a=3.7; 表示a为一个自动存储的临时变量. C++语言 C++ 98标准/C++0 ...

  7. keepalived+nginx 高可用集群

    一.什么是高可用?   nginx做负载均衡,能达到分发请求的目的,但是不能很好的避免单点故障. 1.nginx集群单点问题 分发器宕机怎么处理? 假如nginx服务器挂掉了,那么所有的服务也会跟着瘫 ...

  8. jquery hover(overListener, outListener) || bind('mouseover',methodA).bind('mouseout',methodB)

    1.区别: bind方式,进入外部区域和内部区域都会触发相关方法(methodA 或methodB): hover方式,进入内部区域不会再触发相关方法. 2.example: <body> ...

  9. 为 Drupal 7 构建一个新主题

    主题解释了 Drupal 网站的用户界面 (UI).虽然主题结构并没有明显的变化,但 Drupal 版本 7 配备了一个新的主题实现方法.本文演示了如何创建一个新的 Drupal 7 主题. Drup ...

  10. YCRefreshView-自定义支持上拉加载更多,下拉刷新。。。

    自定义支持上拉加载更多,下拉刷新,支持自由切换状态[加载中,加载成功,加载失败,没网络等状态]的控件,拓展功能[支持长按拖拽,侧滑删除]可以选择性添加 .具体使用方法,可以直接参考demo. 轻量级侧 ...