本文由云+社区发表 作者:老生姜 一.遇到的问题 与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储. cluster.png 然而在一些复杂的应用场景中使用Elasticsearch,经常会遇到分片过多引发的一系列问题.起初我们在支撑内部某业务时,单集群内有约1000个子业务,大部分子业务保留31天的数据.如果每个子业务按天滚动建立Index,每个Index 5个分片.一主两从共三副本的情…
创建索引 无mapping 创建索引名称为index的索引 curl -XPUT http://localhost:9200/book 有mapping 如果需要定义每个类型的结构映射,创建type名称为user和blogpost的mapping. curl -XPUT "http://localhost:9200/book" -d' { "mappings": { "user": { "_all": { "enab…
创建索引 无mapping 创建索引名称为index的索引 curl -XPUT http://localhost:9200/book 有mapping 如果需要定义每个类型的结构映射,创建type名称为user和blogpost的mapping. curl -XPUT "http://localhost:9200/book" -d' { "mappings": { "user": { "_all": { "enab…
Elasticsearch最佳实践之分片使用优化 作者:老生姜 一.遇到的问题 与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储. cluster.png 然而在一些复杂的应用场景中使用Elasticsearch,经常会遇到分片过多引发的一系列问题.起初我们在支撑内部某业务时,单集群内有约1000个子业务,大部分子业务保留31天的数据.如果每个子业务按天滚动建立Index,每个Index…
ELK 性能(4) - 大规模 Elasticsearch 集群性能的最佳实践 介绍 集群规模 集群数:6 整体集群规模: 300 Elasticsearch 实例 141 物理服务器 4200 CPU 核心 38TB RAM 1.5 Pb 存储 索引日志: 100 亿/天 400k/秒 内容 开场白 健康提示 将 Elasticsearch 集群的名称 "elasticsearch" 进行重命名.当网络内有两个以上的集群时,就会发现这样做所带来的好处. 为了防止误删除,设置参数 ac…
如何建模 mapping 设计非常重要,需要从两个维度进行考虑: 功能:搜索.排序.聚合 性能:存储的开锁.内存的开销.搜索的性能 mapping 注意事项: 加入新字段很容易(必要时需要 update_by_query) 更新删除字段不允许(需要 reindex 重建数据) 最佳实践 1.不允许自动新增字段,将 dynamic 设置成 strict.默认为 true: 2.不需要分词的字段,将 type 设置成 keyword.默认使用了多字段特性,text.keyword这2种类型都有: 3…
原文:http://www.oschina.net/translate/best-practices-for-a-pragmatic-restful-api 数据模型已经稳定,接下来你可能需要为web(网站)应用创建一个公开的API(应用程序编程接口).需要认识到这样一个问题:一旦API发布后,就很难 对它做很大的改动并且保持像先前一样的正确性.现在,网络上有很多关于API设计的思路.但是在全部案例中没有一种被广泛采纳的标准,有很多的选择:你接 受什么样的格式?如何认证?API应该被版本化吗?…
更多技术分享可关注我 前言 本文重点总结Netty多线程的一些编码最佳实践和注意事项,并且顺便对Netty的线程调度模型,和异步模型做了一个汇总.原文:​​结合异步模型,再次总结Netty多线程编码最佳实践 Netty多线程编码的最佳实践总结 接该文:Netty的线程调度模型分析(10)<Netty多线程开发的最佳实践有哪些?> 回忆: 1.服务端需要启动两个NioEventLoopGroup,其中boss(新连接接入)线程池大小设置为1即可,设置多了也是1个I/O线程在起作用,而且还浪费内存…
对象存储概念及特性 在介绍 QingStor️对象存储内部的的架构和设计原理之前,我们首先来了解一下对象存储的概念,也就是从外部视角看,对象存储有什么特性,我们应该如何使用. 对象存储本质上是一款存储产品,与其他的存储,如文件存储.块存储,功能是类似的,主要的功能都是数据的读和写.最大的不同在于对象存储是把数据作为对象进行管理,这是它最主要的特征,所有的数据在这里面都当做一个对象处理. 对象存储有一些非常鲜明的特点: 它的结构是扁平的,不像文件存储那样有目录层级,在读写数据时不需要对目录进行层层…
文章根据 Juicedata 工程师朱唯唯,在云原生 Meetup 杭州站所作主题演讲<JuiceFS CSI Driver 的最佳实践>整理而成. 大家好,我是来自 Juicedata 的朱唯唯,现在主要负责 JuiceFS CSI Driver 方面的开发,很高兴今天有这个机会跟大家做一个分享和交流,我今天分享的题目是 "JuiceFS CSI Driver 的最佳实践".主要会从以下几个方面给大家做一个分享: Kubernetes 存储方案 如何在 Kubernete…