<读书报告 – Elasticsearch入门 > 第一章 Elasticsearch入门 Elasticsearch是一个实时的分布式搜索和分析引擎,使得人们可以在一定规模上和一定速度上实现数据检索,常用于全文本检索,结构化检索.分析以及三种的结合应用.Wikipedia.Guardian.Stack Overflow.Github都在使用Elasticsearch实现自己的相关检索工作. 1.1 you konw,for search Elasticsearch是一个基于Apache Lu…
<读书报告 – Elasticsearch入门 > ' 第四章 分布式文件存储 这章的主要内容是理解数据如何在分布式系统中存储. 4.1 路由文档到分片 创建一个新文档时,它是如何确定应该存储在分片1还是分片2上的呢? 这个过程不是随机的,因为将来要检索文档.事实上,它根据一个简单的算法决定: shard = hash(routing) % number_of_primary_shards routing值是一个任意字符串,它默认是_id但也可以自定义.这个routing字符串通过哈希函数生成…
第十三章 全文检索 这一章开始介绍 全文检索 :怎样对全文字段(full-text fields)进行检索以找到相关度最高的文档. 全文检索最重要的两个方面是: 相关度(Relevance) 根据文档与查询的相关程度对结果集进行排序的能力.相关度可以使用TF/IDF.地理位置相近程度.模糊相似度或其他算法计算. 分析(Analysis) 将一段文本转换为一组唯一的.标准化了的标记(token),用以(a)创建倒排索引,(b)查询倒排索引. 注意,一旦提到相关度和分析,指的都是查询(queries…
Part II 深入搜索 搜索不仅仅是全文本搜索:数据的很大部分是结构化的值例如日期.数字.这部分开始解释怎样以一种高效地方式结合结构化搜索和全文本搜索. 第十二章 结构化搜索 结构化搜索_ 是指查询包含内部结构的数据.日期,时间,和数字都是结构化的:它们有明确的格式给你执行逻辑操作.一般包括比较数字或日期的范围,或确定两个值哪个大. 文本也可以被结构化.一包蜡笔有不同的颜色:红色,绿色,蓝色.一篇博客可能被打上 分布式 和 搜索的标签.电子商务产品有商品统一代码(UPCs) 或其他有着严格格式…
搜索引擎我也不是很熟悉,但是数据库还是比较了解.可以把搜索理解为数据库的like功能的替代品.因为like有以下几点不足: 第一.like的效率不行,在使用like时,一般都用不到索引,除非使用前缀匹配,才能用得上索引.但普通的需求并非前缀匹配. 第二.like的不能做到完全的模糊匹配.比如like '%化痰冲剂%'就不能把”化痰止咳冲剂“搜索出来.但是普通的用户,需求就是这样 第三.like无法根据匹配度进行排序.数据库匹配某个关键字的记录可能有好几千,但是用户只能看100条,数据库往往返回用…
一.安装Zookeeper 参考: Zookeeper的下载.安装和启动 Zookeeper 集群搭建--单机伪分布式集群 二.下载Kafka 进入http://kafka.apache.org/downloads 我这里使用版本:kafka_2.11-1.0.1.tgz 三.Kafka目录 解压到/usr/local路径下: tar -zxvf  kafka_2.11-1.0.1.tgz /bin  操作kafka的可执行脚本 /config 配置文件所在的目录 /libs 依赖库目录 /lo…
安装 请参阅elastic官网 :Installing Elasticsearch 启动 使用 ./bin/elasticsearch 命令即可启动 使用 ./bin/elasticsearch -d -p pid 作为 daemon 模式启动(可使用 kill `cat pid` 命令停止). 配置项 elasticsearch.yml for configuring Elasticsearch jvm.options for configuring Elasticsearch JVM set…
1.eslint需要依赖node.js环境,在配置之前需要安装好node.js; 2.npm install eslint --save-dev 或 npm install eslint --save -g 进行全局安装 3.配置到自己的编辑器里面,这里已webstorm为例,ctrl+alt+s调出settings面板,依次配置即可 4.在项目根目录下新建文件.eslintrc并配置如下内容即可: ps:了解更多配置,请查阅https://github.com/yangsendyx/ESLin…
和安装其他软件一样,安装Docker也需要一些基本的前提条件.Docker要求的条件具体如下: 运行64位CPU构架的计算机(目前只能是x86_64和amd64),Docker目前不支持32位CPU. 运行Linux3.8或更高版本的内核. 内核必须支持一种适合的存储驱动(storage driver),例如: Device Manager: AUFS: vfs: btrfs: 默认存储驱动通常是Device Manager. 内核必须支持并开启cgroup和命名空间(namespace)功能.…
这是ElasticSearch 2.4 版本系列的第一篇: ElasticSearch入门 第一篇:Windows下安装ElasticSearch ElasticSearch入门 第二篇:集群配置 ElasticSearch入门 第三篇:索引 ElasticSearch入门 第四篇:使用C#添加和更新文档 ElasticSearch入门 第五篇:使用C#查询文档 ElasticSearch入门 第六篇:复合数据类型——数组,对象和嵌套 ElasticSearch入门 第七篇:分析器 Elasti…