一.elasticsearch背景介绍

1.问题引入:搜索所有天安门相关的内容,大数据量的判断,加索引orm,歌词怎么做?等等问题,大公司上亿条数据怎样开发处理日志?

2.ELK框架,目前先学习E(elasticsearch)

3.Apache是http服务器,美国人发明的,Apache火起来之后,产生了雅加达系列项目,其中就有Tomcat,雅加达目前停止了,原因是子项目都独立出来了.

4.雅加达独立出来的项目,Tomcat,lucene,elasticsearch就是将lucene封装了一层.

5.lucene可以被认为是迄今为止最先进,性能最好,功能最全的搜索引擎库,可惜只是一个库,比较复杂

6.因此我们需要安装java的jdk虚拟机等等

7.elasticsearch天生就是分布式的搜索引擎.,接近实时的搜索

8.有了分布式必然就有高可用,原因是存储的数据量比较大,需要备份数据

9.elasticsearch的缺点:(1)不支持事物(2)相对吃内存

原因:lucene吃内存,所以elasticsearch吃内存.

10.elasticsearch主要用途:做搜索

(1)分布式的实时文件存储,每个字段都被索引并可被搜索

(2)分布式的实时分析搜索引擎

(3)可以扩展到上百台服务器,处理PB级结构化或非结构化数据(文件存储)

11.接口当然选择python

12.开发人Shay Banon,这个elasticsearch天生就是处在高性能和存储数据网格的分布式环境中,因此天生高性能,实时,分布式

13.elasticsearch最早出来是在2010年2月,开源的

14.云计算市场亚马逊,微软,阿里云(打包产品)

15.mongodb是面向文档型的数据库,elasticsearch也是面向文档型的,

文档型的优点:搜索快.没有表关系,与实体相关的都写在文档中,一篇文档就是一个实体.

因为是文档可以是多层次的,文档鼓励你属于一个逻辑实体的数据保存在同一个文档中

mysql优化:少做连表查询

16.百度上解释elasticsearch是一个基于Lucene的搜索服务器.

17.应用案例:苏宁,github,维基百科,苏宁,腾讯PB级别100W/S,字节跳动,站内检索,百度就是,日志分析比较多

18.框架自动处理,主要核心es存储数据分析数据,logstash导入数据,kibana用于查询(图形可视化)

19.主要学习核心:elasticsearch,搜索

20.一个lucene索引也就是一个(elasticsearch)分片,不能处理多于21亿篇文档,或者多于2740亿的唯一词条,超过我们就没有磁盘了.

21.学习外国语言的最好办法就是有个外国的女朋友

二.kibana背景介绍

1.kibana是一个为elasticsearch提供的数据分析的web接口,可使用它对日志进行高效的搜索,可视化,分析等各种操作.

ELK背景介绍1的更多相关文章

  1. ELK环境配置+log4j日志记录

    ELK环境配置+log4j日志记录 1. 背景介绍 在大数据时代,日志记录和管理变得尤为重要. 以往的文件记录日志的形式,既查询起来又不方便,又造成日志在服务器上分散存储,管理起来相当麻烦, 想根据一 ...

  2. ELK菜鸟手记 (一) 环境配置+log4j日志记录

    1. 背景介绍 在大数据时代,日志记录和管理变得尤为重要. 以往的文件记录日志的形式,既查询起来又不方便,又造成日志在服务器上分散存储,管理起来相当麻烦, 想根据一个关键字查询日志中某个关键信息相当困 ...

  3. ELK+KAFKA安装部署指南

    一.ELK 背景 通常,日志被分散的储存不同的设备上.如果你管理数十上百台服务器,你还在使用依次登录每台机器的传统方法查阅日志.这样是不是感觉很繁琐和效率低下.当务之急我们使用集中化的日志管理,例如: ...

  4. 万字长文:ELK(V7)部署与架构分析

    ELK(7版本)部署与架构分析 1.ELK的背景介绍与应用场景 在项目应用运行的过程中,往往会产生大量的日志,我们往往需要根据日志来定位分析我们的服务器项目运行情况与BUG产生位置.一般情况下直接在日 ...

  5. ELK学习实验001:Elastic Stack简介

    1 背景介绍 在我们日常生活中,我们经常需要回顾以前发生的一些事情:或者,当出现了一些问题的时候,可以从某些地方去查找原因,寻找发生问题的痕迹.无可避免需要用到文字的.图像的等等不同形式的记录.用计算 ...

  6. ELK(V7)部署与架构分析

    1.ELK的背景介绍与应用场景 在项目应用运行的过程中,往往会产生大量的日志,我们往往需要根据日志来定位分析我们的服务器项目运行情况与BUG产生位置.一般情况下直接在日志文件中tailf. grep. ...

  7. filebeat+ELK配置及常用操作

    背景介绍 最近工作涉及几台新服务器的日志需要接入ELK系统,配置思路如下: 使用Filebeat收集本地日志数据,Filebeat监视日志目录或特定的日志文件,再发送到消息队列到kafka,然后log ...

  8. ELK 性能优化实践

    文章转载自:https://mp.weixin.qq.com/s?__biz=MzI5MTU1MzM3MQ==&mid=2247489814&idx=1&sn=6916f8b7 ...

  9. ELK日志系统:Filebeat使用及Kibana如何设置登录认证

    根据elastic上的说法: Filebeat is a lightweight, open source shipper for log file data. As the next-generat ...

随机推荐

  1. Ionic 发送Http post PHP 获取不到数据

    1.app.js 配置请求设置 $httpProvider.defaults.headers.post={ 'Content-Type':'application/x-www-form-urlenco ...

  2. cf519E

    传送门 多组询问,问到树上两个点x,y距离相等的点的个数. 倍增求lca. //Twenty #include<cstdio> #include<cstdlib> #inclu ...

  3. leyou_05_文件上传

    1.搭建一个新的微服务Ly-upload用来上传文件 2.导入文件上传到额依赖 <dependencies> <dependency> <groupId>org.s ...

  4. IT外包概要

    IT外包 前两天和朋友聊起这个外包的问题,就顺便给他说了一下,自己也整理了一下,发出来,方便更多的人. 如果有说的不准确的地方欢迎大家补充分享. 大致分两种: 项目外包, 人力外包. 简而言之:项目外 ...

  5. SPSS统计分析案例:无空白列重复正交试验设计方差分析

    SPSS统计分析案例:无空白列重复正交试验设计方差分析 前面有讲过 SPSS正交试验设计及其方差分析 一篇文章,包含了一个典型的正交试验案例.然而在实际应用当中,主观客观条件复杂多变,在试验设计中就要 ...

  6. 谈一谈创建React Component的几种方式

    当我们谈起React的时候,多半会将注意力集中在组件之上,思考如何将页面划分成一个个组件,以及如何编写可复用的组件.但对于接触React不久,还没有真正用它做一个完整项目的人来说,理解如何创建一个组件 ...

  7. 【python之路35】网络编程之socket相关

    Socket socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求. sock ...

  8. UVA11389 The Bus Driver Problem

        题意:有司机,下午路线,晚上路线各n个.给每个司机恰好分配一个下午路线和晚上路线.给出行驶每条路线的时间,如果司机开车时间超过d,则要付加班费d*r.问如何分配路线才能使加班费最少.   贪心 ...

  9. UML类图解释

    那个动物矩形框,它就代表一个类(Class).类图分三层,第一层显示类的名称,如果是抽象类,则就用斜体显示.第二层是类的特性,通常是字段和属性.第三层是类的操作,通常是方法或行为.注意前面的符号,“+ ...

  10. idea中隐藏.idea文件夹和.iml文件

    idea中的.idea文件夹和.iml是平常几乎不使用的文件,在创建父子工程或者聚合工程时反而会对我们操作产生干扰,所以,一般情况下,我们都将其隐藏掉,步骤如下: 操作前: 具体操作:File——&g ...