如果我们把ES作为某种数据库来使用的话,必须熟练掌握ES的CRUD操作。在这之前先更正一下上篇中关于检查索引是否存在的方法:elastic4s的具体调用如下:

  1. //删除索引
  2. val rspExists = client.execute(indexExists("company")).await
  3. if (rspExists.result.exists)
  4. client.execute(deleteIndex("company")).await

在下面我们还会示范如何检查一条记录(document)是否存在的方法。

先示范新建一条记录。一般来讲数据库表都有个唯一字段,最好用ES里的id来代表,否则ES会自动产生一个唯一id,那么随机读取get时就会很不方便。如果新插入的记录id已经在表里存在,ES会替换新的内容,不会产生异常。可以在elastic4s里使用createOnly(true)来强制产生重复id异常:

  1. import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}
  2. import com.sksamuel.elastic4s.akka._
  3. import akka.actor._
  4.  
  5. import scala.concurrent.ExecutionContext.Implicits.global
  6. object Lesson05 extends App {
  7. import com.sksamuel.elastic4s.ElasticDsl._
  8.  
  9. private implicit lazy val system: ActorSystem = ActorSystem()
  10. val akkaClient = AkkaHttpClient(AkkaHttpClientSettings(List("130.1.1.234:9200")))
  11. val client = ElasticClient(akkaClient)
  12.  
  13. val publisher = indexInto("company").id("c00001")
  14. .fields(
  15. "code" -> "c00001",
  16. "name" -> "人民出版社",
  17. "biztype" -> "出版社",
  18. "addr" -> Map(
  19. "district" -> "北京市东城区",
  20. "address" -> "朝阳门内大街166号"
  21. ),
  22. "regdate" -> "1963-02-18",
  23. "contact" -> "65122634@163.com"
  24. ).createOnly(true)
  25.  
  26. val pubExists = client.execute(exists("company","c00001")).await
  27. if (pubExists.isSuccess) {
  28. val createPub = client.execute(publisher).await
  29.  
  30. if (createPub.isSuccess) {
  31. val pub = client.execute(get("company", "c00001").fetchSourceContext(true)).await
  32. println(s"${pub.result.sourceAsMap}")
  33. } else println(s"${createPub.error.reason}")
  34. } else println(s"${pubExists.error.reason}")
  35.  
  36. val dstributor = indexInto("company").id("c00002")
  37. .fields(
  38. "code" -> "c00002",
  39. "name" -> "新华文轩出版传媒股份有限公司",
  40. "biztype" -> "出版发行",
  41. "addr" -> Map(
  42. "district" -> "四川省成都市锦江区",
  43. "address" -> "金石路239号4栋1层1号"
  44. ),
  45. "regdate" -> "2005-03-09",
  46. "contact" -> "52635286@qq.com"
  47. ).createOnly(true)
  48.  
  49. val grpExists = client.execute(exists("company","c00002")).await
  50. if (grpExists.isSuccess) {
  51. val createGroup = client.execute(dstributor).await
  52.  
  53. if (createGroup.isSuccess) {
  54. val dstr = client.execute(get("company", "c00002").fetchSourceContext(true)).await
  55. println(s"${dstr.result.sourceAsMap}")
  56. } else println(s"${createGroup.error.reason}")
  57. } else println(s"${grpExists.error.reason}")
  58.  
  59. val mget = client.execute(multiget(
  60. get("company","c00001"),
  61. get("company","c00002")
  62. )).await
  63. if(mget.isSuccess)
  64. mget.result.items.foreach(i => println(s"${i.sourceAsMap}"))
  65. else println(s"${mget.error.reason}")
  66.  
  67. scala.io.StdIn.readLine()
  68. system.terminate()
  69. client.close()
  70. }

上面示范了不同类型字段的填写方式,特别是nested字段如addr。每插入一条新记录就用get进行一次验证,输出显示:

  1. HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)
  2. HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239411号), biztype -> 出版发行)
  3. HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)
  4. HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239411号), biztype -> 出版发行)

上面提到过,如果我们想把ES当作普通的数据库来使用的话,还是要备齐了CRUD功能。具体操作按照关系数据库方式围绕着唯一键id进行。比如,我们可以用id来检查记录是否已经存在:

  1. val pubExists = client.execute(exists("company","c00001")).await
  2. if (pubExists.isSuccess) {...}

上面我们示范了针对索引的create,read操作。下面讨论一下update:update 可分单笔或批次两类,分别为:updateById, updateByQuery,很明显:updateByQuery是以query作为目标筛选条件的成批update操作。与上面的create操作一样,我们还是需要考虑唯一键id,这个可以在updateById操作里处理:当目标id存在时,用update请求里的字段值更新对应的字段。如目标id不存在的话就把update请求里的字段值当作新记录内容插入:

  1. import com.sksamuel.elastic4s.http.JavaClient
  2. import com.sksamuel.elastic4s.requests.common.RefreshPolicy
  3. import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}
  4. import scala.concurrent.ExecutionContext.Implicits.global
  5. object Lesson06 extends App {
  6. import com.sksamuel.elastic4s.ElasticDsl._
  7.  
  8. val esjava = JavaClient(ElasticProperties("http://localhost:9200"))
  9. val client = ElasticClient(esjava)
  10.  
  11. val doc1 = updateById("company","t00001")
  12. .docAsUpsert(
  13. Map(
  14. "code" -> "t00001",
  15. "name" -> "test company1"
  16. )
  17. )
  18.  
  19. val doc2 = updateById("company","t00002")
  20. .docAsUpsert(
  21. Map(
  22. "code" -> "t00002",
  23. "name" -> "test company2"
  24. )
  25. )
  26.  
  27. val doc3 = updateById("company","t00003")
  28. .docAsUpsert(
  29. Map(
  30. "code" -> "t00003",
  31. "name" -> "test company3"
  32. )
  33. )
  34.  
  35. val updateAll = for {
  36. _ <- client.execute(doc1)
  37. _ <- client.execute(doc2)
  38. _ <- client.execute(doc3)
  39. } yield()
  40. updateAll.await
  41.  
  42. val getResults = client.execute(multiget(
  43. get("company","t00001").fetchSourceInclude("code","name"),
  44. get("company","t00002").fetchSourceInclude("code","name"),
  45. get("company","t00003").fetchSourceInclude("code","name")
  46. )
  47. ).await
  48.  
  49. getResults.result.items.foreach(i => println(i.sourceAsMap))
  50.  
  51. client.close()
  52. }

成批更新比较麻烦,因为通常每条记录的更新都可能涉及到当前记录的字段值,或作为判断条件,或为更新值,我们需要使用并处理当前记录中某些字段。这就需要在数据层面运行某些计算方法,可以用脚本语言来实现这样的功能,如下:

  1. import com.sksamuel.elastic4s.requests.script.Script
  2. val script = "ctx._source.fullname = ctx._source.code+' '+ctx._source.name"
  3. val updateByQ = updateIn("company")
  4. .query(matchQuery("name","test"))
  5. .script(Script(script,Some("painless")))
  6.  
  7. val qupResult = client.execute(updateByQ).await
  8.  
  9. val getResults = client.execute(multiget(
  10. get("company","t00001"),
  11. get("company","t00002"),
  12. get("company","t00003")
  13. )
  14. ).await
  15.  
  16. getResults.result.items.foreach(i => println(i.sourceAsMap))

与update一样,delete也分单个或成批删除模式。delete by Id 示例如下:

  1. (for {
  2. _ <- client.execute(delete("t00001").from("company"))
  3. _ <- client.execute(deleteByQuery("company", "t00002"))
  4. } yield()).await

delete by Query 用法如下:

  1. import com.sksamuel.elastic4s.Index._
  2. client.execute(
  3. deleteByQuery(toIndex("company"),
  4. termQuery("code","t00003"))
  5. ).await

search(6)- elastic4s-CRUD的更多相关文章

  1. search(9)- elastic4s logback-appender

    前面写了个cassandra-appender,一个基于cassandra的logback插件.正是cassandra的分布式数据库属性才合适作为akka-cluster-sharding分布式应用的 ...

  2. 【CF528D】Fuzzy Search(FFT)

    [CF528D]Fuzzy Search(FFT) 题面 给定两个只含有\(A,T,G,C\)的\(DNA\)序列 定义一个字符\(c\)可以被匹配为:它对齐的字符,在距离\(K\)以内,存在一个字符 ...

  3. search(0)- 企业搜索,写在前面

    计划研究一下搜索search,然后写个学习过程系列博客.开动之前先说说学习搜索的目的:不是想开发个什么搜索引擎,而是想用现成的搜索引擎在传统信息系统中引进搜索的概念和方法.对我来说,传统的管理系统le ...

  4. search(16)- elastic4s-内嵌文件:nested and join

    从SQL领域来的用户,对于ES的文件关系维护方式会感到很不习惯.毕竟,ES是分布式数据库只能高效处理独个扁平类型文件,无法支持关系式数据库那样的文件拼接.但是,任何数据库应用都无法避免树型文件关系,因 ...

  5. Hibernate征途(三)之CRUD

    上篇博客<Hibernate征途(二)之基础与核心>介绍了Hibernate的基础内容和核心内容,这篇博客简单实践一下.第一篇博客也说过Hibernate是一种JDBC的简化方案,既然是和 ...

  6. 【阅读笔记】Ranking Relevance in Yahoo Search (一)—— introduction & background

    ABSTRACT: 此文在相关性方面介绍三项关键技术:ranking functions, semantic matching features, query rewriting: 此文内容基于拥有百 ...

  7. search(11)- elastic4s-模糊查询

    很多时候搜索用户对查询语句具有模糊感觉,他们只能提供大约的描述.比如一个语句的部分,或者字句顺序颠倒等.通过模糊查询可以帮助用户更准确的找出他们希望搜索的结果. 模糊查询包括前后缀,语句(phrase ...

  8. search(12)- elastic4s-聚合=桶+度量

    这篇我们介绍一下ES的聚合功能(aggregation).聚合是把索引数据可视化处理成可读有用数据的主要工具.聚合由bucket桶和metrics度量两部分组成. 所谓bucket就是SQL的GROU ...

  9. 关于mysql,需要掌握的基础(一):CRUD、存储引擎、单表查询相关、多表查询join、事务并发、权限管理等等

    目录 关于mysql,需要掌握的基础(一): 1.了解数据库sql.数据库系统.数据库管理系统的概念. 2.了解DDL.DML.DQL语句是什么? 3.了解存储引擎.存储引擎[InnoDB 和 MyI ...

随机推荐

  1. 《面试经典系列》- MySQL数据库存储引擎

    一.MySQL有多少种存储引擎? 在MySQL5之后,支持的存储引擎有十多个,但是我们常用的就那么几种,而且,默认支持的也是 InnoDB. 通过命令:show engines \g,我们可以查看到当 ...

  2. 科普 | ​生成对抗网络(GAN)的发展史

    来源:https://en.wikipedia.org/wiki/Edmond_de_Belamy 五年前,Generative Adversarial Networks(GANs)在深度学习领域掀起 ...

  3. python+selenium环境搭建步骤

    一.自动化简介 1.自动化测试概念: 是把以人为驱动的测试转化为机器执行的一种过程,它是一种以程序测试程序的过程 2.自动化测试分类: 一般IT上所说的自动化测试是指功能自动化测试,通过编码的方式用一 ...

  4. LVS的部署、案例、以及常见问题

    LVS的部署.案例.以及常见问题 原创chenhuyang 最后发布于2018-06-03 16:18:25 阅读数 1560 收藏 展开 一.LVS的部署 LVS现在已经集成在linux内核模块中, ...

  5. intelliJ IDEA 教育版下载教程

    ​声明:本教程针对的是在校本科大学生及以上学历学生群体,因为申请账号需要学校的邮箱来进行验证,所以"社会人士"为了对的起"社会"这两个字,还是花点钱买个正版吧! ...

  6. python 基本知识

    1.windows下Spyder中快捷键 块注释/块反注释 Ctrl + 4/5 断点设置 F12 关闭所有 Ctrl + Shift + W 代码完成 Ctrl +空格键 条件断点 SHIFT + ...

  7. Activiti任务分配

    分配任务负责人 一.固定分配 在进行业务流程建模时指定固定的任务负责人 在properties 视图中,填写Assignee 项为任务负责人. 注意: 由于固定分配方式,任务只管一步一步执行任务,执行 ...

  8. Nutch & Solr & IKAnalyzer Deployment Debug

    Nutch配置错误 (1) IO错误   记得出错的时候把出错的目录删除,否则下次还是出错. (2) Command crawl is deprecated, please use bin/crawl ...

  9. Centos下载新版内核

                                                                                              下载新版内核的安装文 ...

  10. 关于web数据库的相关知识点的操作

    主要是怎样建立与数据库的连接.对于框架是固定的: 下面是对于数据库的连接操作: package com.DBU; //数据库连接 import java.sql.Connection; import ...