本文由云+社区发表 作者:老生姜 一.遇到的问题 与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储. cluster.png 然而在一些复杂的应用场景中使用Elasticsearch,经常会遇到分片过多引发的一系列问题.起初我们在支撑内部某业务时,单集群内有约1000个子业务,大部分子业务保留31天的数据.如果每个子业务按天滚动建立Index,每个Index 5个分片.一主两从共三副本的情…
Elasticsearch最佳实践之分片使用优化 作者:老生姜 一.遇到的问题 与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储. cluster.png 然而在一些复杂的应用场景中使用Elasticsearch,经常会遇到分片过多引发的一系列问题.起初我们在支撑内部某业务时,单集群内有约1000个子业务,大部分子业务保留31天的数据.如果每个子业务按天滚动建立Index,每个Index…
一.遇到的问题 与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储. cluster.png 然而在一些复杂的应用场景中使用Elasticsearch,经常会遇到分片过多引发的一系列问题.起初我们在支撑内部某业务时,单集群内有约1000个子业务,大部分子业务保留31天的数据.如果每个子业务按天滚动建立Index,每个Index 5个分片.一主两从共三副本的情况下,集群内部会有多达45w~个分…
数据库性能最佳实践 当应用须要连接数据库时.那么应用的性能就可能收到数据库性能的影响. 比方当数据库的I/O能力存在限制,或者因缺失了索引而导致运行的SQL语句须要对整张表进行遍历.对于这些问题.只相应用代码进行优化可能是不够.还须要了解数据库的知识和特点. 演示样例数据库 该数据库表示了128仅仅股票在1年内(261个工作日)的股价信息. 当中有两张表:STOCKPRICE和STOCKOPTIONPRICE. STOCKPRICE中使用股票代码作为主键.另外还有日期字段.它有33408条记录(…
本篇文章来说道说道如何诊断HBase写数据的异常问题以及优化写性能.和读相比,HBase写数据流程倒是显得很简单:数据先顺序写入HLog,再写入对应的缓存Memstore,当Memstore中数据大小达到一定阈值(128M)之后,系统会异步将Memstore中数据flush到HDFS形成小文件. 开发者盛宴来袭!7月28日51CTO首届开发者大赛决赛带来技术创新分享 本篇文章来说道说道如何诊断HBase写数据的异常问题以及优化写性能.和读相比,HBase写数据流程倒是显得很简单:数据先顺序写入H…
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题.HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少.总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题.RIT问题.写吞吐量太低以及读延迟较大. Full GC问题之前在一些文章里面已经讲过它的来龙去脉,主要的解决方案目前主要有两方面需要注意,一方面需要查看GC日志确认是哪种Full GC,根据Full GC类型对JVM参数进行调优,另一方…
创建索引 无mapping 创建索引名称为index的索引 curl -XPUT http://localhost:9200/book 有mapping 如果需要定义每个类型的结构映射,创建type名称为user和blogpost的mapping. curl -XPUT "http://localhost:9200/book" -d' { "mappings": { "user": { "_all": { "enab…
创建索引 无mapping 创建索引名称为index的索引 curl -XPUT http://localhost:9200/book 有mapping 如果需要定义每个类型的结构映射,创建type名称为user和blogpost的mapping. curl -XPUT "http://localhost:9200/book" -d' { "mappings": { "user": { "_all": { "enab…
背景:查阅了一下MongoDB的相关文档,发现中文文档还是比较少的,工作中需要用到MongoDB,而这本<MongoDB最佳实践>是很好的选择,所以就把这本手册翻译了一下,其中生涩的专业用语是参考MongoDB中文官网进行翻译,校对的时间比较少,难免会有不合理的地方,恳请大家指正. 简介 MongoDB是一款为广泛的现代应用程序设计的高性能.可扩展.分布式数据库系统.MongoDB可用于不同规模大小的组织,为那些对系统低延迟.高吞吐量以及可持续性有很高要求的应用提供稳定关键的服务. 尽管Mon…
本文转自:http://technet.microsoft.com/zh-cn/magazine/jj717232.aspx 英文版:http://msdn.microsoft.com/library/azure/jj717232.aspx 作者:Mark Simms 和 Michael Thomassy 供稿作者:Jason Roth 和 Ralph Squillace 审阅者:Brad Calder.Dennis Mulder.Mark Ozur.Nina Sarawgi.Marc Merc…