Elastic Search 学习之路(一)
一、基本概念及缘由
1.Sql vs nosql
SQL:Structured Query Language
Nosql:Not only SQL
Relationship DB
Relations:One-to-one relation、One-to-many、Many-to-many、Self-reference
Mongo DB(humongous 大量的)、Redis .ect (内存型数据库)
Structure:Database Collencitons Documents
2.为何使用搜索引擎
项目中的搜索功能,如果数据量较小,那么可以直接使用mysql进行搜索;当数据量到达一定规模后,比如十亿、百亿,这时传统的关系型数据库就已经达到性能瓶颈,不适合这个项目,此时可以使用搜索引擎ElasticSearch。可能你会问,为什么不用内存型数据库。虽然内存型数据库读写性能很高,但是将庞大的数据量全都装进内存中不太现实。比如,使用PB级别的数据,每个内存节点96G的话,那么需要上万个节点,再考虑到数据的备份,那么会更多。这么高的成本,不现实。软件是服务于企业的,企业的目的是盈利。
3.初步认识ElasticSearch
目前常见的搜索引擎的首选,就是开源的ElasticSearch。它可以快速存储、搜索和分析海量数据。它的底层是开源库Lucene(Lucene必须手动去写接口进行调用)。Elastic对Lucene进行了封装,提供了基于Rest API的接口,可以直接操作接口。
(official document path : https://www.elastic.co/guide/en/elasticsearch/reference/current/rest-apis.html)
学习环境:elasticsearch-7.5.2 windows 10
3.1 基本概念
※Node、Cluster※
ElasticSearch的本质是分布式数据库,因此就会有节点(Node),一个节点相当于一个实例,一组节点构成集群(cluster)。
※Index※ES会给所有存储的数据建立索引,经过处理后会有个反向索引。查找数据时直接查找该索引。
※Document※
插入ES中的每条记录都是一个Document。它也是使用JSON格式,多个Document构成了一个Index。
※Type※
分组的类型。
e.g. curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{\"name\": \"John Lee3\"}"
customer 是Index的名字。_doc是type名字。3表示该条记录的ID,它不一定是数字,任意字符串(如:“adc”)都可以。添加数据时,也可以不指定ID,这时,会自动添加一个随机字符串的ID。pretty表示易读的格式返回。
3.2 Get Started
(1)install path https://www.elastic.co/guide/en/elasticsearch/reference/current/install-elasticsearch.html
(2)Run bin/elasticsearch (or bin\elasticsearch.bat on Windows)
(3)Run curl http://localhost:9200/
3.3 memo
我照着官网学习时,用到的命令,复制下来备用。下面命令我亲自执行过,没有问题。
curl -X GET "localhost:9200/_cat/health?v&pretty"
curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{\"name\": \"John Lee3\"}"
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl -X GET "localhost:9200/customer/_doc/1?pretty"
curl "localhost:9200/_cat/indices?v"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d "{\"query\": { \"match_all\": {} },\"sort\": [{ \"account_number\": \"asc\" }]}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"
{
\"query\": { \"match_all\": {} },
\"sort\": [
{ \"account_number\": \"asc\" }
],
\"from\": 10,
\"size\": 10
}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"{ \"query\": { \"match\": { \"address\": \"mill lane\" } }}"
4.踩坑
1.使用curl命令时,注意事项。(环境:windows环境,在cmd.exe下执行的curl命令)
一定要注意双引号以及转义字符。切记。按照官网复制来的命令,会有问题。
curl -H "Content-Type: application/json" -X POST -d "{\"abc\":123}" "https://httpbin.org/post"
参考文档:
https://blog.csdn.net/aisemi/article/details/80212836
https://www.elastic.co/guide/en/elasticsearch/reference/current/elasticsearch-intro.html Elasticsearch official guides
http://www.ruanyifeng.com/blog/2017/08/elasticsearch.html
※
Elastic Search 学习之路(一)的更多相关文章
- Elastic Search 学习之路(三)—— tutorial demo
一.ElasticSearch tutorial demo example 1. 单机.local.CRUD操作 实现方式: SpringBoot + ElasticSearch 拷贝的小demo,原 ...
- Elastic Search 学习之路(二)——inverted index(反向索引)
这是篇翻译文,图画的挺有意思. Elastic使用非常特殊的数据结构,称作反向索引.反向索引中,包括了一组document中出现的唯一的单词,和对应的单词,所出现的位置.反向索引是在ES中,docum ...
- elastic search 学习笔记
Elastic search在数据分析的应用中相当于一个数据库的搜索引擎. 跟MySQL类似,它有自己的查询语言,只不过不是关系型数据库,属于NoSQL. 可以根据索引从分布式服务器文件系统中快速存取 ...
- elastic search 学习 一
初步阅读了elastic search 的文档,并使用command实践操作. 大概明白其概念模型.
- elastic search&logstash&kibana 学习历程(一)es基础环境的搭建
elastic search 6.1.x 常用框架: 1.Lucene Apache下面的一个开源项目,高性能的.可扩展的工具库,提供搜索的基本架构: 如果开发人员需用使用的话,需用自己进行开发,成本 ...
- 12天学好C语言——记录我的C语言学习之路(Day 12)
12天学好C语言--记录我的C语言学习之路 Day 12: 进入最后一天的学习,用这样一个程序来综合考量指针和字符串的关系,写完这个程序,你对字符串和指针的理解应该就不错了. //输入一个字符串,内有 ...
- 12天学好C语言——记录我的C语言学习之路(Day 11)
12天学好C语言--记录我的C语言学习之路 Day 11: 因为指针部分比较的难,所以我们花费的时间也是最长的,希望大家耐的住性子,多多理解,多多打代码.好了,废话不多说,来看第11天的学习. //编 ...
- 12天学好C语言——记录我的C语言学习之路(Day 10)
12天学好C语言--记录我的C语言学习之路 Day 10: 接着昨天的指针部分学习,有这么一个题目: //还是四个学生,四门成绩,只要有学生一门功课没及格就输出这个学生的所有成绩 /*//progra ...
- Python学习之路-Day2-Python基础3
Python学习之路第三天 学习内容: 1.文件操作 2.字符转编码操作 3.函数介绍 4.递归 5.函数式编程 1.文件操作 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个 ...
随机推荐
- java8的stream功能及常用方法
Java8中stream对集合操作做了简化,用stream操作集合能极大程度简化代码.Stream 就如同一个迭代器(Iterator),单向,不可往复,数据只能遍历一次,遍历过一次后就用尽了. 一. ...
- 简单的 通过ID获取文件名称
模型中的方法class 模型名{ /** * 通过ID获取文件名称 */ public static function getNameById($id) { $model = self::findOn ...
- yii2.0 curl的使用
yii2 curl的使用办法 get: use linslin\yii2\curl; public function actionCurl($value =0) { $url = 'http://ya ...
- Meetings S 题解
题目描述 题目链接 有两个牛棚位于一维数轴上的点 \(0\) 和 \(L\) 处.同时有 \(N\) 头奶牛位于数轴上不同的位置(将牛棚和奶牛看作点).每头奶牛 \(i\) 初始时位于某个位置 \(x ...
- Spring Boot 2.4.0正式发布,全新的配置文件加载机制(不向下兼容)
千里之行,始于足下.关注公众号[BAT的乌托邦],有Spring技术栈.MyBatis.JVM.中间件等小而美的原创专栏供以免费学习.分享.成长,拒绝浅尝辄止.本文已被 https://www.you ...
- 做IT需要掌握的电力基础知识
电流 损耗 直流电的传输损耗大,所以不适合长距离传输, 交流电的传输损耗小,所以适合长距离传输, 使用 直流电电压稳定,无白躁声,故适於电子产品使用(例如电视机,收音机电脑等), 交流电要经过整流/开 ...
- CentOS 7搭建本地yum源
问题 CentOS7.1安装rpm包时提示缺失包,有些包iso里面也没有,只能从外网yum,这种情况下,可以提前yum好所需的依赖包,做成一个本地yum源.将这些文件拷贝到没联网的机器就可以使用了. ...
- PyQt(Python+Qt)学习随笔:树型部件QTreeWidget中的项编辑方法editTriggers、editItem和openPersistentEditor作用及对比分析
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 在树型部件QTreeWidget中,有三种方法触发进行项数据的编辑:editTriggers触发编辑 ...
- PyQt(Python+Qt)学习随笔:QTreeWidgetItem项获取项的父项或子项
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 树型部件QTreeWidget中的QTreeWidgetItem项,可以通过child(int in ...
- PyQt(Python+Qt)学习随笔:QListWidgetItem的构造方法
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 QListWidgetItem对象专门用于作为QListWidget对象的一个项. QListWid ...