一、集群机器配置信息

Cloudera集群机器:

10.2.45.104 GBD000.localdomain GBD000
10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311
10.2.45.108 GBD312.localdomain GBD312
10.2.45.109 GBD313.localdomain GBD313
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315

其中10.2.45.105 GBD101.localdomain GBD101是namenode

Zookeeper集群机器:

10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311

Solr Server安装机器:

10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315

二、Solr安装配置

1、使用Cloudera Mamager,在以下机器上安装Solr Server。

10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315

在 HDFS 中创建 /solr 目录:(一般CM安装好Solr之后,在HDFS中已经创建了此目录)

$ sudo -u hdfs hadoop fs -mkdir /solr
$ sudo -u hdfs hadoop fs -chown solr /solr

2、编辑Solr配置文件

使用Parcels安装,Solr的配置文件位置为:

/opt/cloudera/parcels/CDH-5.7.0-1.cdh5.7.0.p0.45/etc/default/solr

修改Zookeeper的连接地址:

SOLR_ZK_ENSEMBLE=<GBD101>:,<GBD102>:,<GBD311>:/solr

修改HDFS的连接地址:

SOLR_HDFS_HOME=hdfs://GBD101.localdomain:8020/solr

设置 HDFS 配置文件目录:

SOLR_HDFS_CONFIG=/etc/hadoop/conf

3、创建Solr运行时配置

在任意一个节点上生成配置文件:

#solrctl instancedir --generate #HOME/solr_configs
solrctl instancedir --generate /usr/local/solr/collection1

/usr/local/solr是已经创建好的自定义目录,collection1为是配置文件生成目录,不需要提前创建,名称可以自定义。

创建collection1实例并将配置文件上传到Zookeeper:

#solrctl instancedir --create collection1 #HOME/solr_configs
solrctl instancedir --create collection1 /usr/local/solr/collection1

通过以下命令查看上传的Instance:

solrctl instancedir --list

配置文件上传到Zookeeper之后,其他节点就可以从上面下载配置文件。接下来创建collection:

solrctl collection --create collection1 -s  -r 

其中-s表示设置Shard数为2,-r表示设置的replica数为1

以上步骤之后,Solr的实例就算创建完毕,可以通过可以通过http://10.2.45.126:8983/solr/#/~cloud查看创建的Collection。

参考文档:

中文版本Cloudera Solr Cloud 配置: http://ae.yyuap.com/pages/viewpage.action?pageId=919744

Cloudera官网配置文档

http://www.cloudera.com/documentation/enterprise/latest/topics/search_deploy_search_solrcloud.html#csig_topic_4_5

Cloudera Search配置的更多相关文章

  1. 基于Cloudera Manager5配置HIVE压缩

    [Author]: kwu 基于Cloudera Manager5配置HIVE压缩,配置HIVE的压缩.实际就是配置MapReduce的压缩,包含执行结果及中间结果的压缩. 1.基于HIVE命令行的配 ...

  2. 基于Cloudera Search设计数据灾备方案

    当实际项目上线到生产环境中,难以避免一些意外情况,如数据丢失.服务器停机等.对于系统的搜索服务来说,当遇到停机的情况意味着在停机这段时间内,用户都不能通过搜索的相关功能进行访问数据,停机意味着将这一段 ...

  3. How-to: Do Real-Time Log Analytics with Apache Kafka, Cloudera Search, and Hue

    Cloudera recently announced formal support for Apache Kafka. This simple use case illustrates how to ...

  4. 2.1、CDH 搭建Hadoop在安装(为Cloudera Manager配置存储库)

    步骤1:为Cloudera Manager配置存储库 使用包管理工具安装Cloudera Manager yum 对于RHEL兼容系统, zypper对于SLES,和 apt-get对于Ubuntu. ...

  5. 1.3.5、CDH 搭建Hadoop在安装之前(端口---Cloudera Search使用的端口)

    Cloudera Search使用的端口 在下表中,每个端口的“ 访问要求”列通常是“内部”或“外部”.在此上下文中,“内部”表示端口仅用于组件之间的通信; “外部”表示该端口可用于内部或外部通信. ...

  6. SharePoint 2013 Search 配置总结

    前言:SharePoint 2013集成了Fast搜索以后,搜索的配置有了些许改变,自己在配置过程中,也记录下了一些入门的东西,希望能够对大家有所帮助. 1.配置搜索服务,首先需要启用搜索功能,基本思 ...

  7. xcodeheader search 配置

    一般我们在xcode里面配置包含工程目录下头文件的时候,都要关联着相对路径和绝对路径,如果只是自己用这个项目,用绝对路径的问题不大,但是如果你把工程发给别人,别人就要在改这个绝对路径,这时候绝对路径的 ...

  8. cloudera search环境搭建搭建-solrcloud

    转载:http://blog.csdn.net/xiao_jun_0820/article/details/40539291 本文基于Cloudera Manager5.0.0,所有服务基于CDH5. ...

  9. cloudera manager配置

    cloudera manager的数据库配置文件位置:    /etc/cloudera-scm-server/db.properties

随机推荐

  1. 【搬运】一分钟快速入门OpenStack

      一.它是什么,能干什么   想认识一个事物,必须先弄明白它是什么,能干什么.   首先说一下,openstack是一个搭建云平台的一个解决方案,说他不是个软件,但是我觉得说是一个软件,能够让初学者 ...

  2. 用Visual Studio创建gtest动态链接库工程

    Step1 创建名为gtest的Win32 Project Step2 在Application Settings中的Application type下选择DLL Step3 把gtest-all.c ...

  3. 《算法问题实战策略》-chaper13-数值分析

    这一章节主要介绍我们在进行数值分析常用的二分.三分和一个近似求解区间积分的辛普森法. 首先介绍二分. 其实二分的思想很好理解并且笔者在之前的一些文章中也有所渗透,对于二次函数甚至单元高次函数的零点求解 ...

  4. python模块之bsddb: bdb高性能嵌入式数据库 1.基础知识

    转自:http://blog.csdn.net/zhaoweikid/article/details/1665741 bsddb模块是用来操作bdb的模块,bdb是著名的Berkeley DB,它的性 ...

  5. 利用golang语法检查对象是否实现了接口

    var _ ipc.Server = &CenterServer{} CenterServer是否实现了 ipc.Server的接口.编译期间检测,这是很好的编程实践. 稍后详述...

  6. setTimeout()的返回值

    今天遇到一个问题,题目如下: var len=4; while(len--){ setTimeout(function(){ console.log(len); },0); console.log(l ...

  7. [Angular 2] Rendering an Observable with the Async Pipe

    Angular 2 templates use a special Async pipe to be able to render out Observables. This lesson cover ...

  8. [Javascript] Introducing Reduce: Common Patterns

    Learn how two common array functions - map() and filter() - are syntactic sugar for reduce operation ...

  9. nginx中时间的管理

    nginx出于性能考虑採用类似lib_event的方式,自己对时间进行了cache,用来降低对gettimeofday()的调用,由于一般来说server对时间的精度要求不是特别的高,只是假设须要比較 ...

  10. DELL R720服务器安装Windows Server 2008 R2 操作系统图文详解

    DELL R720服务器安装Windows Server 2008 R2 操作系统图文详解 说明:此文章中部分图片为网络搜集,所以不一定为DELL R720服务器安装界面,但可保证界面内容接近DELL ...