大数据分析中Redis怎么做到220万ops

大数据时代，海量数据分析就像吃饭一样，成为了我们每天的工作。为了更好的为公司提供运营决策，各种抖机灵甚至异想天开的想法都会紧跟着接踵而来！业务多变，决定了必须每天修改系统，重新跑数据，这就要求极高的海量数据读取和存储速度！

公司每天增加几亿行的业务日志数据，我们需要从中分析出各种维度的业务画像。经过很长时间的摸索，选择了Redis作为读写数据的缓存。

1，开发平台，C#Net，写Windows服务抓取原始日志数据，合并精简压缩后，写入Redis集群。

2，各业务系统从时间维度上遍历Redis缓存数据，逐行分析处理，中间结果和最终结果写入Redis。

3，另一套Windows服务抓取Redis里的结果数据，保存回数据库。这里有点像MQ的工作方式。

实际上，第一步只有一套系统，这是数据基础。第二第三一般每个子系统都有一对。甚至A系统的结果直接访问B系统放在Redis中的结果数据。

整体上看起来耦合度有点高，但是这一套架构得到了极高的速度，单个子系统实例每秒钟可处理1万到10万个订单！并且是很多套子系统同时工作，单一子系统因业务原因不会吃完全部Redis性能。单独对某一台Redis服务器做压力测试，最高得到了222万ops的速度，测试的是比较简单的业务，统计满足某种业务规则的订单总数。

为何需要这么高速度？？

业务规则一旦改变，修改程序后，往往需要重新跑最近一周什么一个月的历史数据。如果每天改几次呢？如果赶上双十一旺季，太慢的速度恐怕连实时数据都赶不上。

Redis怎么做到220万ops

1，Redis是单线程模型，因此32核心服务器安装32个实例

2，数据分片，key散列后均分到几十个实例上

3，关闭持久化，运维和Linux保证可靠性

4，控制好数据包大小，高性能网络通信最忌收发大量小包，控制在1400字节附近最佳，最差也要pipeline

5，其它在网上能轻易找到的细小技巧

为什么不用数据库？？

经过大量验证，同样32核心服务器，数据库3巨头一般得到20000qps的查询速度和接近10000tps的写入速度。这是按照单表几百万数据有两个索引的情况测试。如果数据达到几千万上亿，再多两个索引，读写同时进行，那么速度只剩下四分之一不到。真真一个惨字！

大数据分析，有很多是临时数据，需要合并、叠加、去重等等，它们的生命周期不长，一般24小时或48小时，也有不少是两三个小时，关键是数据量还特别大，每天几千万很常见。这类数据，写数据库是很不合适的。

而使用Redis，一台32U512G机器，可以装下一个月几十亿经过压缩处理的历史数据，资源占用在50%上下。

我是大石头，打1999年起，18年老码农。目前在物流行业从事数据分析架构工作。欢迎大家一起C#大数据

大数据分析中Redis怎么做到220万ops的更多相关文章

【转】大数据分析中Redis怎么做到220万ops
原文:http://www.cnblogs.com/nnhy/archive/2018/01/16/Redis220.html 大数据时代,海量数据分析就像吃饭一样,成为了我们每天的工作.为了更好的为 ...
大数据分析中Redis应用
大数据分析中Redis 大数据时代,海量数据分析就像吃饭一样,成为了我们每天的工作.为了更好的为公司提供运营决策,各种抖机灵甚至异想天开的想法都会紧跟着接踵而来!业务多变,决定了必须每天修改系统,重新 ...
大数据分析中数据治理的重要性，从一个BI项目的失败来分析
很多企业在做BI项目时,一开始的目标都是想通过梳理管理逻辑,帮助企业搭建可视化管理模型与深化管理的精细度,及时发现企业经营管理中的问题. 但在项目实施和验收时,BI却变成了报表开发项目,而报表的需求往 ...
用Storm轻松实时大数据分析【翻译】
原文地址简单易用,Storm让大数据分析变得轻而易举. 如今,公司在日常运作中经常会产生TB(terabytes)级的数据.数据来源包括从网络传感器捕获的,到Web,社交媒体,交易型业务数据,以及其 ...
使用Storm实现实时大数据分析
摘要:随着数据体积的越来越大,实时处理成为了许多机构需要面对的首要挑战.Shruthi Kumar和Siddharth Patankar在Dr.Dobb’s上结合了汽车超速监视,为我们演示了使用Sto ...
使用Storm实现实时大数据分析(转)
原文链接:http://blog.csdn.net/hguisu/article/details/8454368 简单和明了,Storm让大数据分析变得轻松加愉快. 当今世界,公司的日常运营经常会生成 ...
用WPF实现大数据分析，超炫的效果，还带地图
开头语经过一段时间研究,终于实现CS和BS相同效果的大数据展示平台了.首先来看看实现的效果,超炫的效果,客户特别喜欢,个人也非常满意,分享给各位,同大家一起交流学习. 大数据展示平台从上图可以看出 ...
向大家介绍我的新书：《基于股票大数据分析的Python入门实战》
我在公司里做了一段时间Python数据分析和机器学习的工作后,就尝试着写一本Python数据分析方面的书.正好去年有段时间股票题材比较火,就在清华出版社夏老师指导下构思了这本书.在这段特殊时期内,夏老 ...
《基于Apache Kylin构建大数据分析平台》
Kyligence联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿武汉市云升科技发展有限公司董事长,<智慧城市-大数据.物联网和云计算之应用>作者 ...

随机推荐

as 与 is
在存储过程(PROCEDURE)和函数(FUNCTION)中没有区别:在视图(VIEW)中只能用AS:在游标(CURSOR)中只能用IS.
linux应用态下的时间
1.时间值 1.1 日历时间(UTC) 该值是自1 9 7 0年1月1日0 0 : 0 0 : 0 0以来国际标准时间( U T C)所经过的秒数累计值(早期的手册称 U T C为格林尼治标准时间) ...
mybatis 基础
前言 MyBatis作为一款持久层的框架,从最初的ibatis更名,经过五六年的发展更新,如今已经更新到了3.4.5版本.MyBatis通过简单的xml或注解配置,就能将接口和Java的对象映射成数据 ...
DotNetCore跨平台~System.DrawingCore部署Linux需要注意的
回到目录你在windows上使用图像组件没有任务问题,但部署到linux之后,将注意以下几点: 安装nuget包ZKWeb.System.Drawing 项目里还是引用System.DrawingC ...
【十九】require和include的区别
1.require是一个函数,include是一个关键字 2.require是无返回值,include有返回值 3.include()会产生一个警告,而require()则导致一个致命的错误(出现错误 ...
ES6函数的拓展
ES里面现在支持在函数的参数直接给参数赋一个默认值,ES6支持拓展运算符(...)三个英文的点,这个形式如function(...a)这个里面...a可以接受若干的值,这个拓展运算符也可以把若干的值转 ...
小白的Python之路 day4 生成器并行运算
一.概述我们已经明白生成器内部的结构,其实就是通过像函数这样的东西实现的! 多线程和单线程:简单来说多线程就是并行运算,单线程就是串行运算二.生成器执行原理第一步:生成一个生成器第二步:执行 ...
童话故事 --- 什么是SQL Server Browser
高飞狗这几天特别郁闷,不知该如何通过TCP/IP协议连接SQL Server数据库.好在功夫不负有心人,经过几天的刻苦研究,终于得到了答案. 高飞狗呼叫UDP1434端口,"叮铃铃,叮铃铃- ...
回顾2017系列篇（二）：移动端APP设计趋势
移动端APP在2017年经历了诸多的变化, 人工智能.聊天式的界面.响应式设计.虚拟现实(VR)和增强现实(AR)让设计师不断面临新的挑战.研究表明,用户每天耗费在手机和平板上的平均时长为158分钟, ...
RabbitMQ教程（一） ——win7下安装RabbitMQ
RabbitMQ依赖erlang,所以先安装erlang,然后再安装RabbitMQ; 下载RabbitMQ,下载地址: rabbitmq-server-3.5.6.exe和erlang,下载地址:o ...

大数据分析中Redis怎么做到220万ops

大数据分析中Redis怎么做到220万ops的更多相关文章

随机推荐

热门专题