cloudera search环境搭建搭建-solrcloud
转载:http://blog.csdn.net/xiao_jun_0820/article/details/40539291
本文基于Cloudera Manager5.0.0,所有服务基于CDH5.0.0 parcel安装。
CM 安装solr是非常方便的,在集群上添加服务就行了,solrcloud需要zookeeper集群的支持,所以添加solr服务之前,先添加zookeeper服务。在此不赘述。
本文从添加好solr服务之后开始说起,我有4个主机,所以添加solr服务的时候我添加了4个solr server,每台主机一个,在选择相应的zookeeper服务启动solr服务之后,这四个节点就在同一个solrcloud集群里面了。
cm装好的solr服务默认是没有collection的。我们可以利用cloudera提供的一个脚本工具来管理solrcloud,该工具为:solrctl
$ solrctl --help usage: /usr/bin/solrctl [options] command [command-arg] [command [command-arg]] ... Options:
--solr solr_uri
--zk zk_ensemble
--help
--quiet Commands:
init [--force] instancedir [--generate path]
[--create name path]
[--update name path]
[--get name path]
[--delete name]
[--list] collection [--create name -s <numShards>
[-c <collection.configName>]
[-r <replicationFactor>]
[-m <maxShardsPerNode>]
[-n <createNodeSet>]]
[--delete name]
[--reload name]
[--stat name]
[--deletedocs name]
[--list] core [--create name [-p name=value]...]
[--reload name]
[--unload name]
[--status name]
solr服务首次启动的时候,会在hdfs上创建/solr目录,还会在zookeeper上创建/solr节点,zookeeper上的/solr节点下面用来保存了solrcloud的相关配置信息。
由于现在solrcloud上是没有collection的,我们先创建一个collection,命名为collection1,在创建
collection1之前,首先要将配置信息上传到zookeeper上,我们这里就将solr自带的examples里面的那个solr目录下面的
collection1的配置上传,对应cm安装的集群,这个目录在/opt/cloudera/parcels/CDH/share/doc
/solr-doc-4.4.0+cdh5.0.0+178/example/solr目录下面,我们用:
sudo -u solr solrctl instancedir --create collection1
/opt/cloudera/parcels/CDH/share/doc/solr-doc-4.4.0+cdh5.0.0+178/example/solr/collection1
执行该命令后,会将/opt/cloudera/parcels/CDH/share/doc/solr-doc-
4.4.0+cdh5.0.0+178/example/solr/collection1下的conf目录下面的所有文件上传到zookeeper的
/solr/configs下面的collection1目录下面.
OK,配置文件上传了,下一步是创建collection,运行如下命令:
sudo -u solr solrctl collection --create collection1 -s 2
创建一个名叫collection1的collection,有2个shard,我们没写-c参数,就会使用默认与collection
name相同的配置文件目录作为-c的默认配置,也即会使用默认的上一步上传到zookeeper的collection1目录作为默认配置目录.
OK,我们可以检测一下collection是否创建成功,运行:solrctl collection --list,看看有没有collection1
在solr控制台管理页面上的cloud下面可以砍到图形化描述的collection1的拓扑结构,这里两个shard具体分配到哪两个server是由solrcloud自己管理的,我们无需关心。
我们试着给这个collection添加一个document:
cd /opt/cloudera/parcels/CDH/share/doc/solr-doc-4.4.0+cdh5.0.0+178/example/exampledocs
java -Durl=http://master68:8983/solr/collection1/update -jar post.jar ipod_video.xml
然后执行一下查询语句:http://master68:8983/solr/collection1/select?q=*:*
可以查询到刚才我们添加的索引文件,至此,一个简单的solrcloud搭建好了。
cloudera search环境搭建搭建-solrcloud的更多相关文章
- 1.3.5、CDH 搭建Hadoop在安装之前(端口---Cloudera Search使用的端口)
Cloudera Search使用的端口 在下表中,每个端口的“ 访问要求”列通常是“内部”或“外部”.在此上下文中,“内部”表示端口仅用于组件之间的通信; “外部”表示该端口可用于内部或外部通信. ...
- CentOS7 + mono +Jexus 环境的搭建
CentOS7的安装和配置 1,从http://www.centos.org/下载CentOS7的镜像,并在VMWare中创建该镜像的虚拟机,为方便操作,把虚拟机的网络连接设置为桥接模式:在安装过程中 ...
- Cloudera Manager安装_搭建CDH集群
2017年2月22日, 星期三 Cloudera Manager安装_搭建CDH集群 cpu 内存16G 内存12G 内存8G 默认单核单线 CDH1_node9 Server || Agent ...
- 【Python开发】Python中数据分析环境的搭建
注:无论是任何一门语言,刚开始入门的时候,语言运行环境的搭建都是一件不轻松的事情. Python的运行环境 要运行或写Python代码,就需要Python的运行环境,主要的Python有以下三类: 原 ...
- elasticsearch基础----->elasticsearch环境的搭建
这里面我们主要是在ubuntu系统上对elasticsearch进行一个环境的搭建,记录一下这个过程中遇到的一些问题以及解决方案.我总是躲在梦与季节的深处,听花与黑夜唱尽梦魇,唱尽繁华,唱断所有记忆的 ...
- Linux环境下搭建测试环境(LAMP详细说明)
一.安装虚拟机与CentOS7 传送门:https://www.cnblogs.com/mrgavin/p/9372393.html 注意:以下安装,我都是用的root权限. 二.安装Apache1. ...
- maven环境的搭建,lemon-OA办公系统的搭建
当时要搭建activiti工作流,但是这个工作流是基于maven启动的,于是,学习了一下,maven环境的搭建 准备的环境: Jdk 1.6 Eclipse IDE 一个或者 MyEclipse M ...
- JAVA 基础开发环境 vscode 搭建 Windows下VSCode编译运行简单java
JAVA 基础开发环境 vscode 搭建 来源 https://www.cnblogs.com/freewsf/p/7744728.html 对于使用 Visual Studio Code 的 Ja ...
- <关于J2EE环境的搭建>在Fedora21下的Tomcat,Mysql,jdk以及Intellij的搭建过程
题外话:一开始很不情愿写这种没有技术含量的博文,但是网上对于fedora21下的整个J2EE环境的搭建过程的文章实在是少之又少,那我就破个例吧:-p (一)JDK的下载及环境变量的设置 如果你对JDK ...
随机推荐
- DAG最长路径
1.DAG最长路径(不记录路径) int dfs1(int s) { )return dis[s]; ; i < G[s].size(); ++i) { int to = G[s][i]; di ...
- icape3 的使用
在FPGA中,有时需要使用用户代码重配置FPGA,配置的内容可以是flash或者是其他的来源这样FPGA的启动模式有关,在本实验中配置文件是存放在flash中.实际的操作步骤如下: 1:生成一个工程, ...
- python实现进度条--主要用在上传下载文件
在python中进行socket上传文件的时候使用进度条,然后在网上找了好久,找寻相关的进度的条的使用,看了几个,发现总是无法进行调用,主要原因是在进行上传文件的时候,每次传送的数据量是固定的,数据的 ...
- controller 允许跨域访问
1.在controller 上加上 @CrossOrigin(origins = {"http://localhost:7777", "http://someserver ...
- 跟我学算法-吴恩达老师(mini-batchsize,指数加权平均,Momentum 梯度下降法,RMS prop, Adam 优化算法, Learning rate decay)
1.mini-batch size 表示每次都只筛选一部分作为训练的样本,进行训练,遍历一次样本的次数为(样本数/单次样本数目) 当mini-batch size 的数量通常介于1,m 之间 当 ...
- TCP/IP知识总结(TCP/IP协议族读书笔记一)
一.简述TCP/IP协议 Transmission Control Protocol/Internet Protocol的简写,即传输控制协议/互联网互联协议,又名网络通信协议.是Internet最基 ...
- 使用navicat的SSH隧道连接数据库
这几天在连接远程数据库的时候,发现用navicat的普通方法居然连接不上,然后就想用ssh连接试试,开始是报错的,错误是这样的: lost connection to Mysql server at ...
- VS Code设置中文和配置Python环境
前言: Visual Studio Code(以下简称VSCode)是一个轻量且强大的代码编辑器,支持Windows,OS X和Linux.内置JavaScript.TypeScript和Node.j ...
- Information Retrieval II
[Information Retrieval II] 搜索引擎分类: 1.目录式搜索引擎. 2.全文搜索引擎. 3.元搜索引擎(Meta-Search Engine). 搜索引擎的4个阶段:下载(cr ...
- S 联系人新增及更新
一.联系人新增 [Public] ConnectString=host="siebel://10.10.1.139:2321/SBA_82/SMObjMgr_chs ConnectUserN ...