一、基本概念及缘由

1.Sql vs nosql

SQL:Structured Query Language

Nosql:Not only SQL

Relationship DB

Relations:One-to-one relation、One-to-many、Many-to-many、Self-reference

Mongo DB(humongous 大量的)、Redis  .ect (内存型数据库)

Structure:Database Collencitons Documents

2.为何使用搜索引擎

项目中的搜索功能,如果数据量较小,那么可以直接使用mysql进行搜索;当数据量到达一定规模后,比如十亿、百亿,这时传统的关系型数据库就已经达到性能瓶颈,不适合这个项目,此时可以使用搜索引擎ElasticSearch。可能你会问,为什么不用内存型数据库。虽然内存型数据库读写性能很高,但是将庞大的数据量全都装进内存中不太现实。比如,使用PB级别的数据,每个内存节点96G的话,那么需要上万个节点,再考虑到数据的备份,那么会更多。这么高的成本,不现实。软件是服务于企业的,企业的目的是盈利。

3.初步认识ElasticSearch

目前常见的搜索引擎的首选,就是开源的ElasticSearch。它可以快速存储、搜索和分析海量数据。它的底层是开源库Lucene(Lucene必须手动去写接口进行调用)。Elastic对Lucene进行了封装,提供了基于Rest API的接口,可以直接操作接口。

(official document path :  https://www.elastic.co/guide/en/elasticsearch/reference/current/rest-apis.html)

学习环境:elasticsearch-7.5.2  windows 10

3.1 基本概念

Node、Cluster

ElasticSearch的本质是分布式数据库,因此就会有节点(Node),一个节点相当于一个实例,一组节点构成集群(cluster)。

IndexES会给所有存储的数据建立索引,经过处理后会有个反向索引。查找数据时直接查找该索引。

※Document※

插入ES中的每条记录都是一个Document。它也是使用JSON格式,多个Document构成了一个Index。

※Type※

分组的类型。

e.g. curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{\"name\": \"John Lee3\"}"

customer 是Index的名字。_doc是type名字。3表示该条记录的ID,它不一定是数字,任意字符串(如:“adc”)都可以。添加数据时,也可以不指定ID,这时,会自动添加一个随机字符串的ID。pretty表示易读的格式返回。

3.2 Get Started
(1)install path https://www.elastic.co/guide/en/elasticsearch/reference/current/install-elasticsearch.html
(2)Run bin/elasticsearch (or bin\elasticsearch.bat on Windows)
(3)Run curl http://localhost:9200/

3.3 memo

我照着官网学习时,用到的命令,复制下来备用。下面命令我亲自执行过,没有问题。

curl -X GET "localhost:9200/_cat/health?v&pretty"
curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{\"name\": \"John Lee3\"}"
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl -X GET "localhost:9200/customer/_doc/1?pretty"
curl "localhost:9200/_cat/indices?v"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d "{\"query\": { \"match_all\": {} },\"sort\": [{ \"account_number\": \"asc\" }]}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"
{
  \"query\": { \"match_all\": {} },
  \"sort\": [
    { \"account_number\": \"asc\" }
  ],
  \"from\": 10,
  \"size\": 10
}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"{  \"query\": { \"match\": { \"address\": \"mill lane\" } }}"

4.踩坑

1.使用curl命令时,注意事项。(环境:windows环境,在cmd.exe下执行的curl命令)

一定要注意双引号以及转义字符。切记。按照官网复制来的命令,会有问题。

curl -H "Content-Type: application/json" -X POST -d "{\"abc\":123}" "https://httpbin.org/post"

参考文档:

https://blog.csdn.net/aisemi/article/details/80212836

https://www.elastic.co/guide/en/elasticsearch/reference/current/elasticsearch-intro.html      Elasticsearch official guides

http://www.ruanyifeng.com/blog/2017/08/elasticsearch.html

Elastic Search 学习之路(一)的更多相关文章

  1. Elastic Search 学习之路(三)—— tutorial demo

    一.ElasticSearch tutorial demo example 1. 单机.local.CRUD操作 实现方式: SpringBoot + ElasticSearch 拷贝的小demo,原 ...

  2. Elastic Search 学习之路(二)——inverted index(反向索引)

    这是篇翻译文,图画的挺有意思. Elastic使用非常特殊的数据结构,称作反向索引.反向索引中,包括了一组document中出现的唯一的单词,和对应的单词,所出现的位置.反向索引是在ES中,docum ...

  3. elastic search 学习笔记

    Elastic search在数据分析的应用中相当于一个数据库的搜索引擎. 跟MySQL类似,它有自己的查询语言,只不过不是关系型数据库,属于NoSQL. 可以根据索引从分布式服务器文件系统中快速存取 ...

  4. elastic search 学习 一

    初步阅读了elastic search 的文档,并使用command实践操作. 大概明白其概念模型.

  5. elastic search&logstash&kibana 学习历程(一)es基础环境的搭建

    elastic search 6.1.x 常用框架: 1.Lucene Apache下面的一个开源项目,高性能的.可扩展的工具库,提供搜索的基本架构: 如果开发人员需用使用的话,需用自己进行开发,成本 ...

  6. 12天学好C语言——记录我的C语言学习之路(Day 12)

    12天学好C语言--记录我的C语言学习之路 Day 12: 进入最后一天的学习,用这样一个程序来综合考量指针和字符串的关系,写完这个程序,你对字符串和指针的理解应该就不错了. //输入一个字符串,内有 ...

  7. 12天学好C语言——记录我的C语言学习之路(Day 11)

    12天学好C语言--记录我的C语言学习之路 Day 11: 因为指针部分比较的难,所以我们花费的时间也是最长的,希望大家耐的住性子,多多理解,多多打代码.好了,废话不多说,来看第11天的学习. //编 ...

  8. 12天学好C语言——记录我的C语言学习之路(Day 10)

    12天学好C语言--记录我的C语言学习之路 Day 10: 接着昨天的指针部分学习,有这么一个题目: //还是四个学生,四门成绩,只要有学生一门功课没及格就输出这个学生的所有成绩 /*//progra ...

  9. Python学习之路-Day2-Python基础3

    Python学习之路第三天 学习内容: 1.文件操作 2.字符转编码操作 3.函数介绍 4.递归 5.函数式编程 1.文件操作 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个 ...

随机推荐

  1. Collectiont和Collections的区别

    Collectiont 和 Collections 的区别 Collection: 是Java提供的集合接口 存储一组不唯一,无序的对象 有两个子接口 List 和 Set Collections: ...

  2. webug第十四关:存储型XSS

    第十四关:存储型XSS 打开发现是评论区 留言加入xss语句

  3. bWAPP----HTML Injection - Reflected (URL)

    HTML Injection - Reflected (URL) 核心代码 1 <div id="main"> 2 3 <h1>HTML Injection ...

  4. Camtasia中对录制视频进行编辑——行为

    小视频的逐渐兴起,让我们的生活变得多姿多彩,同时,也造就了一批新媒体的创业者还有越来越多的网红,这不禁使我们也想加入他们的行列.但是问题来了,拍摄视频后最重要的是对视频进行剪辑,没有一款经济适用的软件 ...

  5. yii2 删除数据

    直接 model 删除 $model = User::find($id); $model->delete(); 带有条件的删除 $connection ->createCommand() ...

  6. ios开发中如何调用苹果自带地图导航

    前段时间一直在赶项目,在外包公司工作就是命苦,天天加班不说,工作都是和工期合同挂钩的,稍微逾期就有可能被扣奖金,不谈这些伤脑筋的事情了,让我们说说iOS开发中如何调用苹果手机自带的地图. 学习如逆水行 ...

  7. 【CF620E】New Year Tree

    (题面来自luogu) 题意翻译 你有一棵以1为根的有根树,有n个点,每个节点初始有一个颜色c[i]. 有两种操作: 1 v c 将以v为根的子树中所有点颜色更改为c 2 v 查询以v为根的子树中的节 ...

  8. std::unique_ptr使用incomplete type的报错分析和解决

    Pimpl(Pointer to implementation)很多同学都不陌生,但是从原始指针升级到C++11的独占指针std::unique_ptr时,会遇到一个incomplete type的报 ...

  9. kali查看本机ip

  10. 硬RAID和软RAID

    RAID简介: RAID是 Redundant Array of Independent Disks的简写,意为独立磁盘冗余阵列,简称磁盘阵列.基本思想是把多个相对便宜的硬盘结合起来,称为一个磁盘阵列 ...