Solr4.10.2集成Nutch1.9与自带UI界面使用

一、Solr4.10.2与Nutch1.9集成

环境:Solr4.10.2已经配置在Tomcat上

Solr的Tomcat配置详见Solr4.10.2的Tomcat配置

NUTCH_DIR/conf/schema-solr4.xml拷贝到SOLR_HOME/collection1/conf/,重命名为schema.xml,并在<fields>...</fields>最后添加一行

  1. <field name="_version_" type="long" indexed="true" stored="true" multiValued="false"/>
<field name="_version_" type="long" indexed="true" stored="true" multiValued="false"/>

重启Tomcat后即可用Nutch的crawl命令带上solrURL参数进行爬取索引工作了

Nutch1.9的命令使用详见Nutch1.9安装配置与基本使用介绍

在爬取索引后进入solr管理界面可以看到solr下已经有索引好的数据了:

二、Solr4.10.2的自带UI界面(Solritas)

1.拷贝solr-4.10.2\contrib\velocity\lib以及solr-4.10.2\dist下面的所有jar包到SOLR_SERVER\WEB-INF\lib目录下

2.如果不进行上一步集成Nutch,这一步就可以跳过了,如果集成了Nutch则需要在新的schema.xml文件中继续添加配置

①    在</types>前加上

  1. <!-- Money/currency field type. Seehttp://wiki.apache.org/solr/MoneyFieldType
  2. Parameters:
  3. defaultCurrency: Specifies thedefault currency if none specified. Defaults to "USD"
  4. precisionStep:   Specifies the precisionStep for the TrieLongfield used for the amount
  5. providerClass:   Lets you plug in other exchange providerbackend:
  6. solr.FileExchangeRateProvider is the default and takes one parameter:
  7. currencyConfig:name of an xml file holding exchange rates
  8. solr.OpenExchangeRatesOrgProvider uses rates from openexchangerates.org:
  9. ratesFileLocation:URL or path to rates JSON file (default latest.json on the web)
  10. refreshInterval:Number of minutes between each rates fetch (default: 1440, min: 60)
  11. -->
  12. <fieldType name="currency"class="solr.CurrencyField" precisionStep="8"defaultCurrency="USD" currencyConfig="currency.xml" />
  13. <!-- boolean type: "true" or "false" -->
  14. <fieldType name="boolean" class="solr.BoolField"sortMissingLast="true"/>
   <!-- Money/currency field type. Seehttp://wiki.apache.org/solr/MoneyFieldType
Parameters:
defaultCurrency: Specifies thedefault currency if none specified. Defaults to "USD"
precisionStep: Specifies the precisionStep for the TrieLongfield used for the amount
providerClass: Lets you plug in other exchange providerbackend:
solr.FileExchangeRateProvider is the default and takes one parameter:
currencyConfig:name of an xml file holding exchange rates
solr.OpenExchangeRatesOrgProvider uses rates from openexchangerates.org:
ratesFileLocation:URL or path to rates JSON file (default latest.json on the web)
refreshInterval:Number of minutes between each rates fetch (default: 1440, min: 60)
-->
<fieldType name="currency"class="solr.CurrencyField" precisionStep="8"defaultCurrency="USD" currencyConfig="currency.xml" /> <!-- boolean type: "true" or "false" -->

<fieldType name="boolean" class="solr.BoolField"sortMissingLast="true"/>

②    在</fields>前加上

  1. <field name="cat" type="string"indexed="true" stored="true" multiValued="true"/>
  2. <field name="manu_exact" type="string"indexed="true" stored="false"/>
  3. <field name="content_type" type="string"indexed="true" stored="true"multiValued="true"/>
  4. <field name="price" type="float" indexed="true"stored="true"/>
  5. <field name="popularity" type="int"indexed="true" stored="true" />
  6. <field name="inStock" type="boolean"indexed="true" stored="true" />
  7. <dynamicField name="*_s" type="string" indexed="true"  stored="true"/>
  8. <dynamicField name="*_c"  type="currency" indexed="true"  stored="true"/>
  9. <dynamicField name="*_dt" type="date"   indexed="true"  stored="true"/>
   <field name="cat" type="string"indexed="true" stored="true" multiValued="true"/>
<field name="manu_exact" type="string"indexed="true" stored="false"/>
<field name="content_type" type="string"indexed="true" stored="true"multiValued="true"/>
<field name="price" type="float" indexed="true"stored="true"/>
<field name="popularity" type="int"indexed="true" stored="true" />
<field name="inStock" type="boolean"indexed="true" stored="true" />
<dynamicField name="*_s" type="string" indexed="true" stored="true"/>
<dynamicField name="*_c" type="currency" indexed="true" stored="true"/>
<dynamicField name="*_dt" type="date" indexed="true" stored="true"/>

③    在</schema>前加上

  1. <copyField source="author" dest="author_s"/>
  2. <copyField source="price"dest="price_c"/>
 <copyField source="author" dest="author_s"/>
<copyField source="price"dest="price_c"/>

④    中文分词按照之前的方法配置就好,IK分词器配置详见Solr4.10.2的IK Analyzer分词器配置

3.重启Tomcat,访问http://localhost:8080/solr/browse即可

参考资料:Solr browse solritas的使用

nutch1.8+solr 4 配置过程+ikanalayzer2012 中文分词器

本文固定连接:http://blog.csdn.net/fyfmfof/article/details/42803841

Solr4.10.2集成Nutch1.9与自带UI界面使用的更多相关文章

  1. Solr4.10.3安装配置

    系统环境 window版本为:windows 8.1 64位 软件环境 JDK版本:1.7 solr版本:4.10.3 tomcat版本:tomcat 7 安装过程 步骤一:将下载好的solr-4.1 ...

  2. Tomcat部署Solr4.10.4

    前段时间学习solr,兴致勃勃的从官网下载到solr5.3.0最新版本,然后在后期部署时出现了很多问题.首先,4.0到5.0是个大版本更新,下载 的压缩包的文件结构有了很多变化,导致网上很多关于sol ...

  3. Win7下Solr4.10.1和MySql的整合(索引与搜索)

    1.打开D:\webserver\solr\collection1\conf\solrconfig.xml文件,在<requestHandler name="/select" ...

  4. Win7下Solr4.10.1和TomCat8的安装

    1.系统为win7 64位系统,安装有wamp的环境,我的所有网站放在 d:\webserver下,域名指向该目录下的子目录: 2.安装TomCat8到 D:\Tomcat 8.0: 3.在 d:\w ...

  5. Solr-4.10.2与Tomcat整合

    1.将下载的solr解压至D:\solr,拷贝d:\solr\solr-4.10.2\example\webapps\solr.war到Tomcat的webapps\目录中.直接解压 solr.war ...

  6. Solr4.10与tomcat整合并安装中文分词器

    1.solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器.Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展,并对索引. ...

  7. tomcat部署solr4.10

    1.创建solrHome mkdir /opt/solrHome 2.拷贝solr基础数据 /example/solr/* /opt/solrHome 将contrib和dist两个目录拷贝到/opt ...

  8. 10.Solr4.10.3数据导入(DIH全量增量同步Mysql数据)

    转载请出自出处:http://www.cnblogs.com/hd3013779515/ 1.创建MySQL数据 create database solr; use solr; DROP TABLE ...

  9. 9.Solr4.10.3数据导入(post.jar方式和curl方式)

    转载请出自出处:http://www.cnblogs.com/hd3013779515/ 1.使用post.jar方式 java -Durl=http://192.168.137.168:8080/s ...

随机推荐

  1. BZOJ 5020 [THUWC2017]Drown in the math ocean (LCT+求导)

    题目大意: 太长了略 洛谷题面传送门 嗯,数学题 感觉考试要是出这种题我就死翘翘了[逃 不用想都知道要$LCT$维护断边连边,但询问该如何处理呢 利用题目给出的公式 $f(x)=\sum_{i=0}^ ...

  2. 基于element的表单渲染器 (el-form-renderer)

    基于 element-ui 封装的表单渲染器,完整继承了 element 的属性定义,并进行了简单扩展,从而用户能够通过使用一段预设的数据渲染出一个完整的 element 表单. 演示地址 项目地址 ...

  3. 数组实例的 entries(),keys() 和 values()

    数组实例的 entries(),keys() 和 values() entries(),keys()和values(),用于遍历数组.它们都返回一个遍历器对象,可以用for...of循环进行遍历,唯一 ...

  4. 可编辑div,将光标定位到文本之后

    类似qq回复一样,某人评论之后,在对评论进行回复之后,将光标定位到文本之后: function set_focus() { el=document.getElementById('guestbook_ ...

  5. ASP.NET-HTTP管道模型

    HTTP管道模型处理WEB程序很小的一方面.管道模型是类似于Web Services的一种在服务器端处理ASP.NET页面的框架技术 一.管道对象模型 在System.Web的命名空间中处理HTTP的 ...

  6. cogs 466. [NOIP2009] 细胞分裂

    466. [NOIP2009] 细胞分裂 ★★   输入文件:cell.in   输出文件:cell.out   简单对比时间限制:1 s   内存限制:128 MB [问题描述]    Hanks ...

  7. windows server 2008开机自动登陆无密码,关机不必写原因

    运行secpol.sec接下来,在弹出的“本地安全策略”对话框中,依次展开左边树图到“本地策略”-“安全选项”,在右边可以找到“交互式登录 无须按 Ctrl+Alt+Del”,双击该项设置为“已启用” ...

  8. HDU 4308 Contest 1

    纯BFS+优先队列扩展. #include <iostream> #include <cstdio> #include <cstring> #include < ...

  9. C#一个托付的样例

    C#中的函数能够被声明的一个托付所调用. 函数为静态方法.和托付声明的參数返回值要一致.   class Program { delegate float MathOperationDelegate( ...

  10. 号外:Spark 1.3.0公布了,快来一起飞!

    Spark 1.3.0 Release Note Spark 1.3.0在上周五正式公布.真是千呼万唤始出来.本次公布最大的惊喜就是DataFrame.另外一个值得关注的是Spark SQL从Alph ...