Solr本地服务器搭建及查询
0.安装solr之前,确保已安装好java8, java -version 查看是否安装
1.新建本地目录solr1 并 解压两个压缩包文件
tar -xf apache-tomcat-7.0..tar.gz
tar -xf solr-4.10..tgz
mv apache-tomcat-7.0. tomcat7
2.将CATALINA_HOME写入到~/.bashrc
echo "export CATALINA_HOME=$basepath/tomcat7" >> ~/.bashrc
source ~/.bashrc
3.验证tomcat是否可以启动
./tomcat7/bin/startup.sh
curl http://localhost:8080
如果OK,则会出现首页源码,点击网址会如下:
4.配置solr,拷贝必要的包
mkdir -p solr-test
cp -r solr-4.10./example/solr solr-test
cp solr-4.10./dist/solr-4.10..war solr-test/solr/solr.war
cp solr-4.10./example/lib/*.jar tomcat7/lib
cp solr-4.10.3/example/lib/ext/*.jar tomcat7/lib
5.配置本地solr.xml文件
mkdir -p ./tomcat7/conf/Catalina/localhost touch ./tomcat7/conf/Catalina/localhost/solr.xml echo "<?xml version=\"1.0\" encoding=\"utf-8\"?>" > tomcat7/conf/Catalina/localhost/solr.xml
echo " <Context docBase=\"$basepath/solr-test/solr/solr.war\" debug=\"0\" crossContext=\"true\">" >> tomcat7/conf/Catalina/localhost/solr.xml
echo " <Environment name=\"solr/home\" type=\"java.lang.String\" value=\"$basepath/solr-test/solr\" override=\"true\" >" >> tomcat7/conf/Catalina/localhost/solr.xml
echo " </Context>" >> tomcat7/conf/Catalina/localhost/solr.xml
6.配置solr-test/solr/collection1/conf/schema.xml文件
这个可以用xml parser来解决
### . 把所有除id外的field全部注释掉,例如:
### <!-- field name="_root_" type="string" indexed="true" stored="false"/-->
### . 修改id的属性如下:
### <field name="id" type="string" indexed="true" stored="false" required="true" multiValued="false" />
### . 增加一个field叫pat:
### <field name="pat" type="text_general" indexed="true" stored="true" required="true" multiValued="False"/>
### . 把所有copyField注释掉,例如:
### <!-- copyField source="title" dest="text"/–>
7.配置solr-test/solr/collection1/conf/solrconfig.xml
### . 注释掉updateLog:
### <!-- updateLog>
### <str name="dir">${solr.ulog.dir:}</str>
### </updateLog-->
### . 修改update/csv的属性
### <requestHandler name="/update/csv" class="solr.UpdateRequestHandler">
### <lst name="defaults">
### <str name="separator">;</str>
### <str name="header">true</str>
### <str name="encapsulator">"</str>
### <str name="stream.contentType">text/csv</str>
### </lst>
### </requestHandler>
8.导入数据,开始干活
写一个shell脚本,例如:vim sss.sh
里面内容:
#!/bin/bash
basepath=$(cd `dirname $`; pwd)
patpath=$ sort -u $patpath -o pat.unique
awk 'BEGIN{print "id;pat"} {print $0";\""$0"\"";}' pat.unique > pat.csv
./tomcat7/bin/shutdown.sh
./tomcat7/bin/startup.sh
curl "http://localhost:8080/solr/collection1/update/csv?commit=true&stream.file=$basepath/pat.csv&stream.contentType=text/csv;charset=UTF-8"
保存脚本内容
运行:./sss.sh + pat文件
例: ./sss.sh gushi.v4.pat
9.完成,准备检索pat
curl "http://localhost:8080/solr/collection1/select?q=pat:故事名&rows=5" (可以对查的内容和显示数量做调整)
返回xml回显信息
直接进网页可以看到:
好,到目前为止,我们的本地solr服务器基本搭建ok。
10查询测试
本地登入http://localhost:8080/solr/#/ 管理页面,如下:
见我们自己的示例:
这张图可以查很多东西,例如展示的数据结构,数量,很丰富
11.多核查询
以上是配置一个core的方法, 若要配置多个core, 只需要在solr-test/solr下面, 复制一下collection1
# 例如, 为了使不同领域的pat可以分开查询, 可以复制一个core叫navi
# 但一定要记得修改navi下面的core.properties的内容, 里面的name必须跟core的名字一致, 否则solr会无法启动
# cd solr-test/solr
# cp -r collection1 navi
# echo "name=navi" > navi/core.properties
# 添加完core后, 重启tomcat7
# ./tomcat7/bin/shutdown.sh
# ./tomcat7/bin/startup.sh
见效果:
Solr本地服务器搭建及查询的更多相关文章
- Git本地服务器搭建及使用详解
Git本地服务器搭建及使用 Git是一款免费.开源的分布式版本控制系统.众所周知的Github便是基于Git的开源代码库以及版本控制系统,由于其远程托管服务仅对开源免费,所以搭建本地Git服务器也是个 ...
- GIT 基础 &本地服务器搭建
Git是一款免费.开源的分布式版本控制系统.众所周知的Github便是基于Git的开源代码库以及版本控制系统,由于其远程托管服务仅对开源免费,所以搭建本地Git服务器也是个较好的选择,本文将对此进行详 ...
- SVN本地服务器搭建及在Eclipse中的应用
0.说明在程序开发的时候会有很多的版本,通过手动备份的方式不紧麻烦而且低效易出错.使用SVN来管理版本会方便很多,虽然有一些学习成本,但是学会使用之后会使得开发更加的高效.本文介绍如何在本地搭建svn ...
- Git本地服务器搭建
安装编译环境,执行以下命令 [root@centos6 ~]# yum -y install curl curl-devel zlib-devel openssl-devel perl cpio ex ...
- Git系列四之在本地服务器搭建gitlab仓库管理
1.Git仓库管理 现在本地已经创建了git仓库,又在gitlab上创建了一个git仓库,并且让这两个仓库进行远程同步,这样gitlab仓库既可以备份也可以与他人协作管理远程仓库以及根据需要推送或拉取 ...
- Git系列四之在本地服务器搭建gitlab仓库管理(centeros环境下)
1.Git仓库管理 现在本地已经创建了git仓库,又在gitlab上创建了一个git仓库,并且让这两个仓库进行远程同步,这样gitlab仓库既可以备份也可以与他人协作管理远程仓库以及根据需要推送或拉取 ...
- Tomcat本地服务器搭建
首先,下载jdk-8u111-windows-x64.exe,然后配置环境,以安装目录D:\jdk1.8.0_111为例: 新建一个变量: 然后打开path新建两个变量: 最后去控制台敲javac或者 ...
- 本地服务器搭建服务:mysql
话不多少,mysql的优劣不再此讨论. 1.官网地址:https://dev.mysql.com/downloads/mysql/ 下载页面直接 No thanks,just start my do ...
- 本地服务器搭建服务:svn
SVN(使用VisualSVN-server)可视化SVN 服务搭建,适合小白:简单又快捷,深入了解命令行方式等高手请移步官网看教程 1.官网 :http://subversion.apache.or ...
随机推荐
- 服务器上 tomcat 配置了 tomcat-users 但是还是 403 的问题
默认情况下,tomcat 限制了只能本机访问 如果我们想要修改这个设置: 编辑 webapps/manager/META-INF/context.xml <!--<Valve classN ...
- nginx日志增加cookie信息
一.获取全部cookie信息 这个比较方便,直接在nginx.conf文件中添加$http_cookie log_format main '[$time_local] - $remote_addr:$ ...
- git入门篇shell
什么是shell 在计算机科学中,Shell俗称壳,用来区别于Kernel(核),是指“提供使用者使用界面”的软件(命令解析器),它类似于windows系统下的cmd.exe, 它接收用户命令,然后调 ...
- JAVA多线程提高四:多个线程之间共享数据的方式
多个线程访问共享对象和数据的方式 如果每个线程执行的代码相同,可以使用同一个Runnable对象,这个Runnable对象中有那个共享数据,例如,买票系统就可以这么做. 如果每个线程执行的代码不同,这 ...
- Zepto学习笔记
Zepto和jQuery的很多API都很一致,思路也很相似,我不会全都整理出来,只是把一些平时用到了的或者不同的地方需要注意一下的地方总结出来.另外,Zepto现在还不是很成熟,无论是对大小写的敏感还 ...
- Netty 入门初体验
Netty简介 Netty是一款异步的事件驱动的网络应用程序框架,支持快速开发可维护的高性能的面向协议的服务器和客户端.Netty主要是对java 的 nio包进行的封装 为什么要使用 Netty 上 ...
- css3背景色过渡
<!DOCTYPE html><html lang="zh-cmn-Hans"><head><meta charset="utf ...
- NYOJ 202 红黑树 (二叉树)
题目链接 描述 什么是红黑树呢?顾名思义,跟枣树类似,红黑树是一种叶子是黑色果子是红色的树... 当然,这个是我说的... <算法导论>上可不是这么说的: 如果一个二叉查找树满足下面的红黑 ...
- wifi钓鱼 强势拿你的wifi密码
钓鱼wifi 首先设一个场景!!! 如何得到一个免费的wifi 有人可能做过抓包跑包的方法或者跑pin码的方法然而这些方法可能会耗去你大量的时间(我曾经跑包花了一天的时间 跑pin码花了一晚上)感 ...
- GO-指针与函数
一.指针类型 1.普通类型,变量存的就是值,也叫值类型.指针类型存的是地址 2.获取变量的地址,用&,比如:var a int, 获取a的地址 &a 3.指针类型,变量存的是一个地址, ...