前提

人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需,大型企业早已淹没在系统生成的浩瀚数据流当中。大数据技术业已集中在如何存储和处理这些海量的数据上。Elasticsearch 作为开源领域的后起之秀,从2010年至今得到飞跃式的发展。 Elasticsearch 以其开源、分布式、RESTFul API 三大优势,已经成为当下风口中“会飞的猪”。

在我的电脑本地写了几篇 ElasticSearch 的源码解析了,回过头来想想应该也写一篇为何我会去看它的源码?

为什么呢?下面我讲讲自己从接触搜索到现在看源码的过程!

关注我

转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/08/24/why-see-es-code/

第一次接触搜索

搜索,我们首先想到的是搜索引擎:Google、百度,这个就算是接触的最早的了。

我自己项目里面接触搜索是大二暑假那时练习的一个项目,里面用了 Solr,然后当时自己也稍微了解了下,并用在了项目里面。

第二次接触搜索

从第一次项目里面用到了搜索,后面自己对这方面就比较感兴趣。再一次接触搜索是实习的时候进公司。第一件事情就是被老大叫的去学习搭建 Elasticsearch 集群,于是乎,电脑就装了三个虚拟机,Elasticsearch 就一个个的装了起来了。也记录了博客下来:Elasticsearch 系列文章(二):全文搜索引擎 Elasticsearch 集群搭建入门教程,当时搭建的时候 ES 的版本才刚从 2.x 升级到 5.x 呢,截止本文时间 2018.08.04,现在 ES 版本已经是到 7.0 了,这版本升级是真的的快,这也说明了 ES 的活跃度很高,背后的开发工程师维护也快,侧面突出要去看它源码的重要性。

当时自己在本地测试搭建集群后,给分配了另外一个任务就是去了解 ES 中的自带分词、英文分词、中文分词的相同与差异、以及自己建立分词需要注意的点。于是乎:当时在公司 wiki 贡献了这篇文章:Elasticsearch 系列文章(一):Elasticsearch 默认分词器和中分分词器之间的比较及使用方法。这篇文章几乎已经把市面上所有的分词都写进去了,包括他们的相同点、不同点、如何使用、如何自定义分词器。

然后还有就是我同组的一个同学,她的任务就是 2.x 升级到 5.x 中 mapping 的大改变有哪些?后面我也看了她总结的文档,很详细!

在这次接触了 ES 后,因为我自己本地已经有环境了,所以自己测试了一些功能,给 ES 安装插件(IK、x-pack、支持 sql 的、),后面自己也去测试 ES 的索引、文档、REST API。

第三次接触搜索

由于是自己对其感兴趣,所以后面就去找了些相关的视频,比如:中华石衫的《Elasticsearch 顶尖高手系列-高手进阶篇》几个系列视频教程个人感觉还是不错的,看完这几个系列估计入门肯定是没有问题的。版权原因,不提供下载链接。

另外就是《Elasticsearch 权威指南》翻译的版本,翻译还没有全,可以去看看,讲得很详细的,市面上应该还没有哪本书讲的有这么清楚,如果英文不错的可以直接啃英文吧。

还有就是官网的文档了,非常非常详细,还有 demo,2.x 版本的是有中文的官方文档,可以凑合着看。

学习新东西,要学会先看官方文档,何况 Elasticsearch 的官方文档这么详细呢!

第四次接触搜索

后面实习的时候,又分配了公司中间件监控的两个模块:Elasticsearch 和 HBase 组件的监控。于是乎,再次有机会接触 Elasticsearch 了,这次主要还是利用 Elasticsearch 自带的 REST API :_cluster/health_cluster/stats_nodes_nodes/stats 去获取到集群的健康信息、节点信息(内存、CPU、网络、JVM等信息)。为了做这个项目自己当时也去找了网上很多类似的文章参考常用的监控指标和他们是怎么做监控的。我当时的任务主要还是采集信息,然后存到公司大项目的 influxdb 中,最后用 grafana 展示出来,后面我组的运维大佬给我看了监控大盘,界面挺酷炫的,哈哈哈,牛逼!

当时写的两篇博客:

1、Elasticsearch 系列文章(三):ElasticSearch 集群监控

2、Elasticsearch 系列文章(四):ElasticSearch 单个节点监控

取之网络,还之网络,希望给后面做类似任务的小伙伴给点参考意见!

再就是自己搭建 ELK(ElasticSearch, Logstash, Kibana)日志分析平台,然后玩了下!

搭建环境博客:Elasticsearch 系列文章(五):ELK 实时日志分析平台环境搭建

第五次接触搜索

后面就没怎么接触 ElasticSearch 了,一直忙着其他的东西。

实习辞职后,毕业出来找工作的那段日子,自己又花了一星期稍微过了一遍 《Elasticsearch 权威指南》 这本书,话说还帮我面试挺过不少关呢,哈哈哈!因为我项目里写了 Elasticsearch 的监控,如果你对 Elasticsearch 其他的不熟悉,面试官稍微问些其他关于这方面的,那就不知道就有点尴尬

渣渣菜鸡为什么要看 ElasticSearch 源码?的更多相关文章

  1. 渣渣菜鸡的 ElasticSearch 源码解析 —— 启动流程(下)

    关注我 转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/08/12/es-code03/ 前提 上篇文章写完了 ES 流程启动的一部分,main 方法都入 ...

  2. 渣渣菜鸡的 ElasticSearch 源码解析 —— 启动流程(上)

    关注我 转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/08/11/es-code02/ 前提 上篇文章写了 ElasticSearch 源码解析 -- ...

  3. 渣渣菜鸡的 ElasticSearch 源码解析 —— 环境搭建

    关注我 转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/08/25/es-code01/ 软件环境 1.Intellij Idea:2018.2版本 2. ...

  4. 【Orleans开胃菜系列2】连接Connect源码简易分析

    [Orleans开胃菜系列2]连接Connect源码简易分析 /** * prism.js Github theme based on GitHub's theme. * @author Sam Cl ...

  5. ElasticSearch源码解析(五):排序(评分公式)

    ElasticSearch源码解析(五):排序(评分公式) 转载自:http://blog.csdn.net/molong1208/article/details/50623948   一.目的 一个 ...

  6. elasticsearch源码分析之search模块(server端)

    elasticsearch源码分析之search模块(server端) 继续接着上一篇的来说啊,当client端将search的请求发送到某一个node之后,剩下的事情就是server端来处理了,具体 ...

  7. 【实习记】2014-08-15文档太少看着源码用cgicc+stl库之模板谓词函数对象

        总结1: 今天找到了昨天scanf的问题答案,scanf与printf一样的神奇而复杂,稍不留神,就会被坑.scanf函数在读入非空白符分割的多个字符串的解决方法是这个:/* 以 | 分割 * ...

  8. 边看MHA源码边学Perl语言之一开篇

    边看MHA源码边学Perl语言之一开篇 自我简介 先简单介绍一下自己,到目前为此我已经做了7年左右的JAVA和3年左右php开发与管理,做java时主要开发物流行业的相关软件,对台湾快递,国际快递,国 ...

  9. 带着萌新看springboot源码8(spring ioc源码 完)

    上一节说到实例化了所有的单实例Bean,后面还有一步遍历 12.完成容器刷新(finishRefresh();) 那个和生命周期有关的后置处理器类型是LifecycleProcessor:监听器原理我 ...

随机推荐

  1. codeforces B. Polo the Penguin and Matrix 解题报告

    题目链接:http://codeforces.com/problemset/problem/289/B 题目意思:给出一个 n 行 m 列的矩阵和数值 d .通过对矩阵里面的数进行 + d 或者 - ...

  2. tflearn数据预处理

    #I just added a function for custom data preprocessing, you can use it as: minmax_scaler = sklearn.p ...

  3. Oracle数据常用操作

    将用逗号隔开字段拆分成两行: select * from mp_fs_file_info a,dm_process_upload b where instr(b.attachment,a.file_i ...

  4. codevs 2456栅栏

    传送门 2456 栅栏 2006年省队选拔赛四川  时间限制: 1 s  空间限制: 128000 KB  题目等级 : 大师 Maste   题目描述 Description 农夫约翰打算建立一个栅 ...

  5. netty学习2

    一.Netty分层设计 Netty 采用了比较典型的三层网络架构进行设计,逻辑架构图如下所示: #第一层,Reactor 通信调度层,它由一系列辅助类完成,包括 Reactor 线程 NioEvent ...

  6. HBase之四--(3):hbasehbase分页查询

    为了广大技术爱好者学习netty,在这里帮新浪微博@nettying宣传下他出版的新书 <netty权威指南>@nettying兄在华为NIO实践多年,这本书是他的技术和经验的一个结晶.N ...

  7. 5.js屏蔽方向键,兼容IE和firefox

    document.onkeydown=function(e){ e=e||event; //屏蔽向左的方向键 if(e.keyCode==37){ alert('禁止向左的方向键!'); return ...

  8. staruml详解

    一.用例图   1.说明        1.1  用例图说明的事谁要使用系统以及他们使用该系统可以做些什么?  <业务需求>        1.2  解析一个用例图,我们可以发现它包含4个 ...

  9. Codeforces Round #408( Div2)

    Bank Hacking 阅读题,读完之后手算一下可以发现每一个bank被hack所需要的strength无非分为三种情况. 1. $a_i$,当且仅当i为第一个选择的点. 2. $a_i+1$,当且 ...

  10. many-to-one 配置问题

    需要引入org.hibernate.annotations.NotFound,当预期的被关联的元素不在数据库(关乎关联列的错误id)时,致使Hibernate无法解决关联性问题时,Hibernate就 ...