search（6）- elastic4s-CRUD

如果我们把ES作为某种数据库来使用的话，必须熟练掌握ES的CRUD操作。在这之前先更正一下上篇中关于检查索引是否存在的方法：elastic4s的具体调用如下：

  //删除索引

  val rspExists = client.execute(indexExists("company")).await

  if (rspExists.result.exists)

     client.execute(deleteIndex("company")).await

在下面我们还会示范如何检查一条记录（document）是否存在的方法。

先示范新建一条记录。一般来讲数据库表都有个唯一字段，最好用ES里的id来代表，否则ES会自动产生一个唯一id，那么随机读取get时就会很不方便。如果新插入的记录id已经在表里存在，ES会替换新的内容，不会产生异常。可以在elastic4s里使用createOnly(true)来强制产生重复id异常：

import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}

import com.sksamuel.elastic4s.akka._

import akka.actor._

import scala.concurrent.ExecutionContext.Implicits.global

object Lesson05 extends App {

  import com.sksamuel.elastic4s.ElasticDsl._

  private implicit lazy val system: ActorSystem = ActorSystem()

  val akkaClient = AkkaHttpClient(AkkaHttpClientSettings(List("130.1.1.234:9200")))

  val client = ElasticClient(akkaClient)

  val publisher = indexInto("company").id("c00001")

    .fields(

      "code" -> "c00001",

      "name" -> "人民出版社",

      "biztype" -> "出版社",

      "addr" -> Map(

        "district" -> "北京市东城区",

        "address" -> "朝阳门内大街166号"

      ),

      "regdate" -> "1963-02-18",

      "contact" -> "65122634@163.com"

    ).createOnly(true)

  val pubExists = client.execute(exists("company","c00001")).await

  if (pubExists.isSuccess) {

    val createPub = client.execute(publisher).await

    if (createPub.isSuccess) {

      val pub = client.execute(get("company", "c00001").fetchSourceContext(true)).await

      println(s"${pub.result.sourceAsMap}")

    } else println(s"${createPub.error.reason}")

  } else println(s"${pubExists.error.reason}")

  val dstributor = indexInto("company").id("c00002")

    .fields(

      "code" -> "c00002",

      "name" -> "新华文轩出版传媒股份有限公司",

      "biztype" -> "出版发行",

      "addr" -> Map(

        "district" -> "四川省成都市锦江区",

        "address" -> "金石路239号4栋1层1号"

      ),

      "regdate" -> "2005-03-09",

      "contact" -> "52635286@qq.com"

    ).createOnly(true)

  val grpExists = client.execute(exists("company","c00002")).await

  if (grpExists.isSuccess) {

    val createGroup = client.execute(dstributor).await

    if (createGroup.isSuccess) {

      val dstr = client.execute(get("company", "c00002").fetchSourceContext(true)).await

      println(s"${dstr.result.sourceAsMap}")

    } else println(s"${createGroup.error.reason}")

  } else println(s"${grpExists.error.reason}")

  val mget = client.execute(multiget(

    get("company","c00001"),

    get("company","c00002")

  )).await

  if(mget.isSuccess)

    mget.result.items.foreach(i => println(s"${i.sourceAsMap}"))

  else println(s"${mget.error.reason}")

  scala.io.StdIn.readLine()

  system.terminate()

  client.close()

}

上面示范了不同类型字段的填写方式，特别是nested字段如addr。每插入一条新记录就用get进行一次验证，输出显示：

HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)

HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239号4栋1层1号), biztype -> 出版发行)

HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)

HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239号4栋1层1号), biztype -> 出版发行)

上面提到过，如果我们想把ES当作普通的数据库来使用的话，还是要备齐了CRUD功能。具体操作按照关系数据库方式围绕着唯一键id进行。比如，我们可以用id来检查记录是否已经存在：

  val pubExists = client.execute(exists("company","c00001")).await

  if (pubExists.isSuccess) {...}

上面我们示范了针对索引的create,read操作。下面讨论一下update：update 可分单笔或批次两类，分别为：updateById, updateByQuery，很明显：updateByQuery是以query作为目标筛选条件的成批update操作。与上面的create操作一样，我们还是需要考虑唯一键id，这个可以在updateById操作里处理：当目标id存在时，用update请求里的字段值更新对应的字段。如目标id不存在的话就把update请求里的字段值当作新记录内容插入：

import com.sksamuel.elastic4s.http.JavaClient

import com.sksamuel.elastic4s.requests.common.RefreshPolicy

import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}

import scala.concurrent.ExecutionContext.Implicits.global

object Lesson06 extends App {

  import com.sksamuel.elastic4s.ElasticDsl._

  val esjava = JavaClient(ElasticProperties("http://localhost:9200"))

  val client = ElasticClient(esjava)

  val doc1 = updateById("company","t00001")

      .docAsUpsert(

        Map(

          "code" -> "t00001",

          "name" -> "test company1"

        )

      )

  val doc2 = updateById("company","t00002")

    .docAsUpsert(

      Map(

        "code" -> "t00002",

        "name" -> "test company2"

      )

    )

  val doc3 = updateById("company","t00003")

    .docAsUpsert(

      Map(

        "code" -> "t00003",

        "name" -> "test company3"

      )

    )

  val updateAll = for {

    _ <- client.execute(doc1)

    _ <- client.execute(doc2)

    _ <- client.execute(doc3)

  } yield()

  updateAll.await

  val getResults = client.execute(multiget(

     get("company","t00001").fetchSourceInclude("code","name"),

     get("company","t00002").fetchSourceInclude("code","name"),

     get("company","t00003").fetchSourceInclude("code","name")

   )

  ).await

  getResults.result.items.foreach(i => println(i.sourceAsMap))

  client.close()

}

成批更新比较麻烦，因为通常每条记录的更新都可能涉及到当前记录的字段值，或作为判断条件，或为更新值，我们需要使用并处理当前记录中某些字段。这就需要在数据层面运行某些计算方法，可以用脚本语言来实现这样的功能，如下：

  import com.sksamuel.elastic4s.requests.script.Script

  val script = "ctx._source.fullname = ctx._source.code+' '+ctx._source.name"

  val updateByQ = updateIn("company")

    .query(matchQuery("name","test"))

    .script(Script(script,Some("painless")))

  val qupResult = client.execute(updateByQ).await

  val getResults = client.execute(multiget(

     get("company","t00001"),

     get("company","t00002"),

     get("company","t00003")

   )

  ).await

  getResults.result.items.foreach(i => println(i.sourceAsMap))

与update一样，delete也分单个或成批删除模式。delete by Id 示例如下：

  (for {

    _ <- client.execute(delete("t00001").from("company"))

    _ <- client.execute(deleteByQuery("company", "t00002"))

  } yield()).await

delete by Query 用法如下：

  import com.sksamuel.elastic4s.Index._

  client.execute(

    deleteByQuery(toIndex("company"),

      termQuery("code","t00003"))

  ).await

search（6）- elastic4s-CRUD的更多相关文章

search（9）- elastic4s logback-appender
前面写了个cassandra-appender,一个基于cassandra的logback插件.正是cassandra的分布式数据库属性才合适作为akka-cluster-sharding分布式应用的 ...
【CF528D】Fuzzy Search（FFT）
[CF528D]Fuzzy Search(FFT) 题面给定两个只含有$A,T,G,C$的$DNA$序列定义一个字符$c$可以被匹配为:它对齐的字符,在距离$K$以内,存在一个字符 ...
search（0）- 企业搜索，写在前面
计划研究一下搜索search,然后写个学习过程系列博客.开动之前先说说学习搜索的目的:不是想开发个什么搜索引擎,而是想用现成的搜索引擎在传统信息系统中引进搜索的概念和方法.对我来说,传统的管理系统le ...
search（16）- elastic4s-内嵌文件：nested and join
从SQL领域来的用户,对于ES的文件关系维护方式会感到很不习惯.毕竟,ES是分布式数据库只能高效处理独个扁平类型文件,无法支持关系式数据库那样的文件拼接.但是,任何数据库应用都无法避免树型文件关系,因 ...
Hibernate征途（三）之CRUD
上篇博客<Hibernate征途(二)之基础与核心>介绍了Hibernate的基础内容和核心内容,这篇博客简单实践一下.第一篇博客也说过Hibernate是一种JDBC的简化方案,既然是和 ...
【阅读笔记】Ranking Relevance in Yahoo Search （一）—— introduction & background
ABSTRACT: 此文在相关性方面介绍三项关键技术:ranking functions, semantic matching features, query rewriting: 此文内容基于拥有百 ...
search（11）- elastic4s-模糊查询
很多时候搜索用户对查询语句具有模糊感觉,他们只能提供大约的描述.比如一个语句的部分,或者字句顺序颠倒等.通过模糊查询可以帮助用户更准确的找出他们希望搜索的结果. 模糊查询包括前后缀,语句(phrase ...
search（12）- elastic4s-聚合=桶+度量
这篇我们介绍一下ES的聚合功能(aggregation).聚合是把索引数据可视化处理成可读有用数据的主要工具.聚合由bucket桶和metrics度量两部分组成. 所谓bucket就是SQL的GROU ...
关于mysql，需要掌握的基础（一）：CRUD、存储引擎、单表查询相关、多表查询join、事务并发、权限管理等等
目录关于mysql,需要掌握的基础(一): 1.了解数据库sql.数据库系统.数据库管理系统的概念. 2.了解DDL.DML.DQL语句是什么? 3.了解存储引擎.存储引擎[InnoDB 和 MyI ...

随机推荐

【Vulnhub练习】Tr0ll 1
下载: https://www.vulnhub.com/entry/tr0ll-1,100/#download 说明: Tr0ll的灵感来自OSCP实验室中不断摇曳的机器. 目标很简单,获得根目录并从 ...
通过源码理解Spring中@Scheduled的实现原理并且实现调度任务动态装载
前提最近的新项目和数据同步相关,有定时调度的需求.之前一直有使用过Quartz.XXL-Job.Easy Scheduler等调度框架,后来越发觉得这些框架太重量级了,于是想到了Spring内置的S ...
Centos7部署k8s[v1.16]高可用[keepalived]集群
实验目的一般情况下,k8s集群中只有一台master和多台node,当master故障时,引发的事故后果可想而知. 故本文目的在于体现集群的高可用,即当集群中的一台master宕机后,k8s集群通过 ...
java NIO理解分析与基本使用
我前段时间的一篇博客java网络编程--多线程数据收发并行总结了服务端与客户端之间的收发并行实践.原理很简单,就是针对单一客户端,服务端起两个线程分别负责read和write操作,然后线程保持阻塞等待 ...
剑指offer刷题总结
★ 二维数组的查找在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否 ...
140行Python代码实现Flippy Bird
140行代码实现Flippy Bird 话说这游戏中文名叫什么来着,死活想不起来了,算了话不多说,140行实现小游戏系列第二章,依然是简单小游戏,与数独游戏相比,在游戏界面显示上更难一些,但是在逻辑方 ...
qt creator源码全方面分析(3-6)
目录 qtcreatorplugin.pri 使用实例上半部下半部结果 qtcreatorplugin.pri 上一节我们介绍了qtcreatorlibrary.pri,现在我们介绍qtcrea ...
SpringMVC知识大览
SpringMVC大览 springMVC的基础知识什么是SpringMVC? springmvc框架原理(掌握) 前端控制器.'处理映射器.处理适配器.视图解析器 springmvc的入门程序目 ...
git本地新建分支推送到远程
$ git checkout -b “分支名称”: 新建本地分支 $ git branch: 查看是否创建成功以及目前在哪个分支 $ gi ...
C#通用类库整理--日志记录
日志的记录是将程序过程中的一些行为数据记录下来,方便开发.运维迅速的找到问题的所在,节省时间.使用时在站点的web.config 中的<appSettings></appSetti ...

search（6）- elastic4s-CRUD

search（6）- elastic4s-CRUD的更多相关文章

随机推荐

热门专题