SolrCloud 分布式集群部署步骤

安装软件包准备

apache-tomcat-7.0.54
jdk1.7
solr-4.8.1
zookeeper-3.4.5

注：以上软件都是基于 Linux 环境的 64位软件，以上软件请到各自的官网下载。

服务器准备

为搭建这个集群，准备三台服务器，分别为

192.168.0.2 -- master 角色
192.168.0.3 -- slave 角色
192.168.0.4 -- slave 角色

搭建基础环境

安装 jdk1.7 - 这个大家都会安装，就不费键盘了。
配置主机 /etc/hosts 文件 - 当然，如果内部有内部DNS解析，就不需要配置 hosts文件了。在 3 台服务器的 /etc/hosts中添加以下记录

192.168.0.2 SOLR-CLOUD-001

192.168.0.3 SOLR-CLOUD-002

192.168.0.4 SOLR-CLOUD-003

zookeeper 部署

Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

注：Zookeeper集群的机器个数推荐是奇数台，半数机器挂掉，服务是可以正常提供的

首先以 192.168.0.2 为例来搭建 zookeeper：

在软件部署目录下面部署 zookeeper，把下载的 zookeeper-3.4.5 解压到软件部署目录 /apps/svr

注：为了统一部署，以及以后自动化方便，必须统一软件部署目录，目前我这边是以 ``/apps/svr``` 为软件部署主目录
建立 zookeeper 的数据、日志以及配置文件目录

mkdir -p /apps/data/zookeeper-data/

mkdir -p /apps/data/zookeeper-data/logs/

mkdir -p /apps/svr/zookeeper-3.4.5/conf

注： /apps/data 是定义的统一存放数据的目录

把 zookeeper 的 conf 目录下面的 zoo_sample.cfg 修改成 zoo.cfg，并且对其内容做修改

cp -av /apps/svr/zookeeper-3.4.5/conf/zoo_sample.cfg /apps/svr/zookeeper-3.4.5/conf/zoo.cfg

修改 zoo.cfg 的内容，主要是修改 dataDir 、dataLogDir 和 server.1-3

# The number of milliseconds of each tick

tickTime=2000

# The number of ticks that the initial

# synchronization phase can take

initLimit=10

# The number of ticks that can pass between

# sending a request and getting an acknowledgement

syncLimit=5

# the directory where the snapshot is stored.

# do not use /tmp for storage, /tmp here is just

# example sakes.

dataDir=/apps/data/zookeeper-data

dataLogDir=/apps/data/zookeeper-data/logs

server.1=SOLR-CLOUD-001:2888:3888

server.2=SOLR-CLOUD-002:2888:3888

server.3=SOLR-CLOUD-003:2888:3888

# the port at which the clients will connect

clientPort=2181

#

# Be sure to read the maintenance section of the

# administrator guide before turning on autopurge.

#

# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance

#

# The number of snapshots to retain in dataDir

#autopurge.snapRetainCount=3

# Purge task interval in hours

# Set to "0" to disable auto purge feature

#autopurge.purgeInterval=1

注：
tickTime：这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳。
initLimit：这个配置项是用来配置 Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器的客户端，而是 Zookeeper服务器集群中连接到 Leader 的 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间（也就是tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是52000=10秒。
syncLimit：这个配置项标识 Leader 与 Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就是 22000=4 秒
dataDir：顾名思义就是 Zookeeper 保存数据的目录，默认情况下，Zookeeper 将写数据的日志文件也保存在这个目录里。
dataLogDir： Zookeeper的日志文件位置。
server.A=B：C：D：其中 A 是一个数字，表示这个是第几号服务器；B是这个服务器的 ip 地址；C 表示的是这个服务器与集群中的 Leader服务器交换信息的端口；D 表示的是万一集群中的 Leader 服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader，而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式，由于 B 都是一样，所以不同的 Zookeeper 实例通信端口号不能一样，所以要给它们分配不同的端口号。
clientPort：这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求。

同步 zookeeper 的配置以及相关目录到其他两台服务中

scp -r /apps/svr/zookeeper-3.4.5 solr@192.168.0.3:/apps/svr

scp -r /apps/data/zookeeper-data solr@192.168.0.3:/apps/data

scp -r /apps/svr/zookeeper-3.4.5 solr@192.168.0.4:/apps/svr

scp -r /apps/data/zookeeper-data solr@192.168.0.4:/apps/data

创建 myid 文件存储该机器的标识码，比如 server.1 的标识码就是 “1”，myid文件的内容就一行： 1

192.168.0.2

echo "1" >> /apps/data/zookeeper-data/myid

192.168.0.3

echo "2" >> /apps/data/zookeeper-data/myid

192.168.3

echo "3" >> /apps/data/zookeeper-data/myid

分别启动三台服务器的 zookeeper

cd /apps/svr/zookeeper-3.4.5/bin

./zkServer.sh start

查看 zookeeper 的状态

[solr@SOLR-CLOUD-001 bin]$ ./zkServer.sh status

JMX enabled by default

Using config: /apps/svr/zookeeper-3.4.5/bin/../conf/zoo.cfg

Mode: leader

[solr@SOLR-CLOUD-002 bin]$ ./zkServer.sh status

JMX enabled by default

Using config: /apps/svr/zookeeper-3.4.5/bin/../conf/zoo.cfg

Mode: follower

[solr@SOLR-CLOUD-003 bin]$ ./zkServer.sh status

JMX enabled by default

Using config: /apps/svr/zookeeper-3.4.5/bin/../conf/zoo.cfg

Mode: follower

Solrcloud分布式集群搭建

解压部署 tomcat - 解压部署后的目录为 /apps/svr/apache-tomcat-7.0.54
解压 solr-4.8.1 的压缩包，并且把 solr-4.8.1/example/webapps/solr.war 解压至 /apps/svr/solr 目录下
把 solr-4.8.1\example\lib\ext 下的 jar 包放到 solr\WEB-INF\lib 下
以 192.168.0.2 为例，创建以下目录

mkdir -p /apps/svr/solrcloud/config-files

mkdir -p /apps/svr/solrcloud/solr-lib

把 solr/WEB-INF/lib 下的所有 jar 包拷贝到 /apps/svr/solrcloud/solr-lib 目录

cp -av /apps/svr/solr/WEB-INF/lib/*.jar /apps/svr/solrcloud/solr-lib

solr/example/solr/collection1/conf 下的所有文件拷贝到 /apps/svr/solrcloud/config-files 目录

cp -av /apps/svr/solr/example/solr/collection1/conf/* /apps/svr/solrcloud/config-files/

将 /apps/svr/solr 目录拷贝到 /apps/svr/apache-tomcat-7.0.54/webapps 目录下面

cp -av /apps/svr/solr /apps/svr/apache-tomcat-7.0.54/webapps

创建 solr 的数据目录 /apps/svr/solr-cores 并在该目录下生成 solr.xml，这是 solr 的核心配置文件

<?xml version="1.0" encoding="UTF-8" ?>

<solr persistent="true">

<logging enabled="true">

<watcher size="100" threshold="INFO" />

</logging>

<cores defaultCoreName="collection1" adminPath="/admin/cores" host="${host:}" hostPort="8080" hostContext="${hostContext:solr}" zkClientTimeout="${zkClientTimeout:15000}">

    <core numShards="3" name="test_shard1_replica1" instanceDir="test_shard1_replica1" shard="shard1" collection="test" coreNodeName="192.168.0.2:8080_solr_test_shard1_replica1"/>

    <core name="userinfo_shard1_replica3" instanceDir="userinfo_shard1_replica3" shard="shard1" collection="userinfo" coreNodeName="192.168.0.2:8080_solr_userinfo_shard1_replica3"/>

    <core name="userinfo_shard2_replica3" instanceDir="userinfo_shard2_replica3" shard="shard2" collection="userinfo" coreNodeName="192.168.0.3:8080_solr_userinfo_shard2_replica3"/>

    <core numShards="3" name="userinfo_shard3_replica1" instanceDir="userinfo_shard3_replica1" shard="shard3" collection="userinfo" coreNodeName="192.168.0.4:8080_solr_userinfo_shard3_replica1"/>

</cores>

</solr>

注：上面的配置文件中有 shard 的信息，那是因为我已经分片了自动生成的

原始的配置文件如下

<?xml version="1.0" encoding="UTF-8" ?>

<solr persistent="true">

<logging enabled="true">

<watcher size="100" threshold="INFO" />

</logging>

<cores defaultCoreName="collection1" adminPath="/admin/cores" host="${host:}" hostPort="8080" hostContext="${hostContext:solr}" zkClientTimeout="${zkClientTimeout:15000}">

</cores>

</solr>

创建/apps/svr/apache-tomcat-7.0.54/conf/Catalina 目录和 /apps/svr/apache-tomcat-7.0.54/conf/Catalina/localhost 目录

mkdir -p /apps/svr/apache-tomcat-7.0.54/conf/Catalina

mkdir -p /apps/svr/apache-tomcat-7.0.54/conf/Catalina/localhost

在 /apps/svr/apache-tomcat-7.0.54/conf/Catalina/localhost 下创建 solr.xml 文件，此文件为 Solr/home 的配置文件

<?xml version="1.0" encoding="UTF-8"?>

<Context docBase="/apps/svr/tomcat-solr/webapps/solr" debug="0" crossContext="true">

<Environment name="solr/home" type="java.lang.String" value="/apps/svr/solr-cores" override="true"/>

</Context>

修改 tomcat/bin/cataina.sh ,加入以下内容

CATALINA_OPTS="$CATALINA_OPTS -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9060 -Djava.rmi.server.hostname=`/sbin/ifconfig bond0 |grep -a "inet addr:" |awk -F":" '{print $2}' |egrep -o '([0-9]{1,3}\.?){4}'`"

CATALINA_OPTS="$CATALINA_OPTS -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"

JAVA_OPTS="$JAVA_OPTS -DzkHost=GD6-SOLR-CLOUD-001:2181,GD6-SOLR-CLOUD-002:2181,GD6-SOLR-CLOUD-003:2181"

JAVA_OPTS="$JAVA_OPTS -Xmx8192m -Xms8192m -Xmn4g -Xss256k -XX:ParallelGCThreads=24 -XX:+UseConcMarkSweepGC -XX:PermSize=256m -XX:MaxPermSize=256m -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCApplicationStoppedTime -XX:+PrintGCApplicationConcurrentTime -XX:+PrintHeapAtGC -Xloggc:/apps/logs/tomcat/gc`date +%Y%m%d%H%M%S`.log -XX:ErrorFile=\"/apps/logs/tomcat/java_error.log\""

将以上配置同步到其他两台服务器

scp -r /apps/svr/apache-tomcat-7.0.54 solr@192.168.0.3:/apps/svr

scp -r /apps/svr/solrcloud solr@192.168.0.3:/apps/svr

scp -r /apps/svr/solr-cores solr@192.168.0.3:/apps/svr

scp -r /apps/svr/apache-tomcat-7.0.54 solr@192.168.0.4:/apps/svr

scp -r /apps/svr/solrcloud solr@192.168.0.4:/apps/svr

scp -r /apps/svr/solr-cores solr@192.168.0.4:/apps/svr

SolrCloud 是通过 ZooKeeper 集群来保证配置文件的变更及时同步到各个节点上，所以，需要将配置文件上传到 ZooKeeper 集群中：执行如下操作（以下ip均可使用域名进行操作）

java -classpath .:/apps/svr/solrcloud/solr-lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost 192.168.0.2:2181,192.168.0.3:2181,192.168.0.4:2181 -confdir /apps/svr/solrcloud/config-files/  -confname myconf

校验 zookeeper 的配置文件

cd /apps/svr/zookeeper-3.4.5/bin

./zkCli.sh -server 192.168.0.2:2181

[zk: 192.168.01.2:2181(CONNECTED) 0] ls /

[configs, collections, zookeeper]

[zk: 192.168.01.2:2181(CONNECTED) 1] ls /configs

[myconf]

[zk: 192.168.01.2:2181(CONNECTED) 2] ls /configs/myconf

[admin-extra.menu-top.html, currency.xml, protwords.txt, mapping-FoldToASCII.txt, solrconfig.xml, lang, stopwords.txt, spellings.txt, mapping-ISOLatin1Accent.txt, admin-extra.html, xslt, scripts.conf, synonyms.txt, update-script.js, velocity, elevate.xml, admin-extra.menu-bottom.html, schema.xml]

[zk: 192.168.01.2:2181(CONNECTED) 3]

启动 tomcat ，首先启动 master 192.168.0.2 上面的 tomcat

cd /apps/svr/apache-tomcat-7.0.54/bin

./startup.sh

启动 192.168.0.3 和 192.168.0.4 的 tomcat
访问 http://192.168.0.2:8080/solr 可以看到下图

创建 Collection 及初始 Shard

 curl 'http://192.168.0.2:8080/solr/admin/collections?action=CREATE&name=userinfo&numShards=3&replicationFactor=1'

 curl 'http://192.168.0.2:8080/solr/admin/collections?action=CREATE&name=userinfo&numShards=3&replicationFactor=1'

 curl 'http://192.168.0.2:8080/solr/admin/collections?action=CREATE&name=userinfo&numShards=3&replicationFactor=1'

对 solrcloud 做读写性能测试的 demo

import java.io.IOException;

import java.util.ArrayList;

import java.util.Collection;  

import org.apache.solr.client.solrj.SolrQuery;

import org.apache.solr.client.solrj.SolrServer;

import org.apache.solr.client.solrj.SolrServerException;

import org.apache.solr.client.solrj.impl.CloudSolrServer;

import org.apache.solr.client.solrj.response.QueryResponse;

import org.apache.solr.common.SolrDocument;

import org.apache.solr.common.SolrDocumentList;

import org.apache.solr.common.SolrInputDocument;

import org.apache.commons.logging.Log;

import org.apache.commons.logging.LogFactory;   

public class SolrCloudTest {

        public static final Log LOG = LogFactory.getLog(SolrCloudTest.class);

        private static CloudSolrServer cloudSolrServer;    

        private  static synchronized CloudSolrServer getCloudSolrServer(final String zkHost) {

         LOG.info("connect to :"+zkHost+"\n");

            if(cloudSolrServer == null) {

                try {

                    cloudSolrServer = new CloudSolrServer(zkHost);

                }catch(Exception e) {

                    e.printStackTrace();

                }

            }

            return cloudSolrServer;

        }    

        private void addIndex(SolrServer solrServer) {

            try {

                   Collection<SolrInputDocument> docs = new ArrayList<SolrInputDocument>();

                   for (int i = 0;i<=200;i++){

                            SolrInputDocument doc = new SolrInputDocument();

                            String key = "";

                            key = String.valueOf(i);

                            doc.addField("id", key);

                            doc.addField("test_s", key+"value");

                            docs.add(doc);

                   }

                LOG.info("docs info:"+docs+"\n");

                solrServer.add(docs);

                solrServer.commit();

            }catch(SolrServerException e) {

                System.out.println("Add docs Exception !!!");

                e.printStackTrace();

            }catch(IOException e){

                e.printStackTrace();

            }catch (Exception e) {

                System.out.println("Unknowned Exception!!!!!");

                e.printStackTrace();

            }

        }                         

        public void search(SolrServer solrServer, String Str) {

            SolrQuery query = new SolrQuery();

            query.setRows(20);

            query.setQuery(Str);

            try {

                   LOG.info("query string: "+ Str);

                   System.out.println("query string: "+ Str);

                QueryResponse response = solrServer.query(query);

                SolrDocumentList docs = response.getResults();

                System.out.println(docs);

                System.out.println(docs.size());

                System.out.println("doc num:" + docs.getNumFound());

                System.out.println("elapse time:" + response.getQTime());

                for (SolrDocument doc : docs) {

                    String area = (String) doc.getFieldValue("test_s");

                    String id = (String) doc.getFieldValue("id");

                    System.out.println("id: " + id);

                    System.out.println("tt_s: " + area);

                    System.out.println();

                }

            } catch (SolrServerException e) {

                e.printStackTrace();

            } catch(Exception e) {

                e.printStackTrace();

            }

        } 

        public static void main(String[] args) {

                final String zkHost = "192.168.0.2:8080";

                final String  defaultCollection = "userinfo";

                final int  zkClientTimeout = 10000;

                final int zkConnectTimeout = 10000;

                CloudSolrServer cloudSolrServer = getCloudSolrServer(zkHost);

                cloudSolrServer.setDefaultCollection(defaultCollection);

                cloudSolrServer.setZkClientTimeout(zkClientTimeout);

                cloudSolrServer.setZkConnectTimeout(zkConnectTimeout);

                try{

                   cloudSolrServer.connect();

                    System.out.println("connect solr cloud zk sucess");

                } catch (Exception e){

                   LOG.error("connect to collection "+defaultCollection+" error\n");

                   System.out.println("error message is:"+e);

                   e.printStackTrace();

                   System.exit(1);

                }

                SolrCloudTest solrt = new SolrCloudTest();

                try{

                   solrt.addIndex(cloudSolrServer);

                } catch(Exception e){

                   e.printStackTrace();

                }

                solrt.search(cloudSolrServer, "id:*");            ;

                cloudSolrServer.shutdown();

        }

    }

总结

最后为了快速部署，其实这个过程可以使用 fabric 来进行部署，这样就不用每次进行重复操作，把上面的步骤整理成 fabric 脚本即可，这样不管是搭建多少台服务器的集群，只要几分钟即可搞定。

注：该文章参考了 http://lucien-zzy.iteye.com/blog/2002463

solr 集群（SolrCloud 分布式集群部署步骤）的更多相关文章

Solr系列二：solr-部署详解（solr两种部署模式介绍、独立服务器模式详解、SolrCloud分布式集群模式详解）
一.solr两种部署模式介绍 Standalone Server 独立服务器模式:适用于数据规模不大的场景 SolrCloud 分布式集群模式:适用于数据规模大,高可靠.高可用.高并发的场景二.独 ...
SolrCloud分布式集群部署步骤
Solr及SolrCloud简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成 ...
170825、SolrCloud 分布式集群部署步骤
安装软件包准备 apache-tomcat-7.0.54 jdk1.7 solr-4.8.1 zookeeper-3.4.5 注:以上软件都是基于 Linux 环境的 64位软件,以上软件请到各自的 ...
SolrCloud 分布式集群部署步骤
https://segmentfault.com/a/1190000000595712 SolrCloud 分布式集群部署步骤 solr solrcloud zookeeper apache-tomc ...
Hadoop1.X集群完全分布式模式环境部署
Hadoop1.X集群完全分布式模式环境部署 1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统(HDFS,Hadoop Distri ...
Hadoop学习之路（十二）分布式集群中HDFS系统的各种角色
NameNode 学习目标理解 namenode 的工作机制尤其是元数据管理机制,以增强对 HDFS 工作原理的理解,及培养 hadoop 集群运营中“性能调优”.“namenode”故障问题的分 ...
Hadoop（五）分布式集群中HDFS系统的各种角色
NameNode 学习目标理解 namenode 的工作机制尤其是元数据管理机制,以增强对 HDFS 工作原理的理解,及培养 hadoop 集群运营中“性能调优”.“namenode”故障问题的分 ...
Git复习（一）之简介、安装、集中式和分布式
简介 Git是分布式版本控制系统,使用C语言开发的,CVS.SVN是集中式的版本控制系统,集中式的版本控制系统不但速度慢,而且必须联网才能使用. Git是分布式版本控制系统,同一个Git仓库,可以分 ...
Solr集群—SolrCloud
1. 学习计划 1.solr集群搭建 2.使用solrj管理solr集群 3.把搜索功能切换到集群版 2. 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜 ...

随机推荐

Eclipse中Spring插件的安装及使用
一.安装流程 1.Help——Install New Software——在Work With中添加地址http://dist.springsource.com/release/TOOLS/updat ...
Thinkphp手把手练习
一.搭建thinkphp开发环境准备条件:thinkphp框架 1.在Apache的www目录下新建文件夹,命名为thinkphp,可以将THinkPHP框架放在该目录中. 2.在thinkphp目 ...
「FJ2014集训」采药人的路径
啦啦啦来写一篇题解洛谷链接: P4930 「FJ2014集训」采药人的路径统计路径?嗯往点分治上想. 把0和1转化为-1和1,求和完dis为0的路径就是阴阳平衡的路径了. 如果题目没有限制要有中 ...
luogu3455 [POI2007]ZAP-Queries 简单的莫比乌斯反演
link ms是莫比乌斯反演里最水的题... 题意:对于给定的整数a,b和d,有多少正整数对x,y,满足x<=a,y<=b,并且gcd(x,y)=d. 多组询问, T<=50000, ...
DoS（拒绝服务攻击）与DDoS（分布式拒绝服务攻击）
SYN Flood是当前最流行的DoS(拒绝服务攻击)与DDoS(分布式拒绝服务攻击)的方式之一,这是一种利用TCP协议缺陷,发送大量伪造的TCP连接请求,从而使得被攻击方资源耗尽(CPU满负荷或内存 ...
CF1101A Minimum Integer 模拟
题意翻译题意简述给出qqq组询问,每组询问给出l,r,dl,r,dl,r,d,求一个最小的正整数xxx满足d∣x d | x\ d∣x 且x̸∈[l,r] x \not\in [l,r]x̸∈[l ...
IDEA 中使用 git(Git)
GitLab GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的web服务.安装方法是参考GitLab在GitHub上的Wiki页面. Git Git( ...
Git的安装使用
1.什么是Git Git是一个自由和开源的分布式版本管理工具,用于有效.高速的处理任何或大或小的项目.最初由Linux Torvalds编写,用于帮助管理Linux内核开发而开发的一个开放源码的版本管 ...
Django 09 博客小案例
Django 09 博客小案例 urls.py from django.urls import path from . import views urlpatterns = [ path('index ...
C#学习之按钮点击事件
描述:asp.net中服务器控件Button的点击事件OnClientClick和OnClick的区别? 解答:http://www.cnblogs.com/ypfnet/archive/2012/1 ...

solr 集群（SolrCloud 分布式集群部署步骤）