生产环境中学习Redis
摘要
看到这篇文章,很有借鉴意义,因此写个读书笔记,不算是翻译。想要深入了解,请看原文http://tech.trivago.com/2017/01/25/learn-redis-the-hard-way-in-production/?utm_source=wanqu.co&utm_campaign=Wanqu+Daily&utm_medium=website
使用场景
旅店搜索应用,使用redis来做缓冲,以及作为将数据搬到其他存储或者传统意义的数据库之前的一个临时存储。数据主要是旅店元数据以及数据的持久化
问题
发布了一些新功能,平台上增加了一些新的语言。然后HTTP请求在短时间内翻倍了。因为硬件方面的高可用性,能够处理这些增长。但是近来的请求有40%response是HTTP 500: Internal Server Error.
查看日志发现,这和redis connection处理有关,大部分是redis error on connection 以及 redis server went away.
google 一下发现有相关的issue了。
debug read error on connection
Debugging 来解决问题
首先尝试了issue中给出的建议,但是没有用。而且这些问题只出现在高并发情况下。
在web请求结束关闭redis connection
没有使用php-fpm以及持久化连接。意味着每一个HTTP请求都会创建一个新的Redis连接,打开了一个连接,但是从来没有关闭它。
在最新的PHP版本中,PHP会自动关闭连接。
注:
不了解PHP,没使用php-fpm。但是这个错误不应该放,数据库的连接不关闭,一个请求创建一个新的连接。这样很容易导致内存泄漏,OOM。不清楚为什么系统运行了三年还没有发现这个问题。
A/B 测试 connections libraries
怀疑是phpredis(php extension)的bug。将C extension退回到predis包。发现仍然有问题。
升级redis
从redis2.6升级到redis2.8.9还是有问题
Debugging 延迟问题
Watchdog
来debug 延迟问题。为了识别出长时间跑的以及阻塞的命令
建议
Redis是单线程的,所以每一个命令都有可能阻塞其他命令。这点一定要牢记于心。虽然是显而易见的特性,但是常常被忽略,而且这是很多问题的根本
使用了Watchdog后,遇到了个bug,redis server down掉了。
redis crashes during rdb save point
看了下redis baseline 延迟,一切正常
redis-cli --latency -p 6380 -h 1.2.3.4
min: 0, max: 463, avg: 2.03 (19443 samples)
查看了redis log,发现redis每隔一分钟将数据保存到磁盘中。
[20398] 22 May 09:25:23.299 * 10000 changes in 60 seconds. Saving...
[20398] 22 May 09:25:23.644 * Background saving started by pid 42027
第一个问题是为什么一个后台保存进程的fork需要400+ms.
因为需要复制page table
因此如果你有个大的Redis实例有很多keys,就会需要很多时间去完成。详情看这篇Fork time in different systems
后面讲Redis snapshot关掉了,因为services不需要这样的持久化。这样做法将读错误降低了30%。
建议
review下你对redis持久化的需求以及redis配置。应用是否会更改很多的keys,考虑使用AOF或者定时的BGSAVE作为持久化方案,而不是标准的snapshotting。
我们错误的根源就在于此。读和写keys,不想全面的禁掉持久化。因此使用一个定时任务去调用BGSAVE命令。将这些任务放在slave实例上。对于持久化要求更高的场合,使用AOF。
这样的一个改变,里面降低了timeout/error的问题。但是仍然会看到有错误抛出。
生产环境中学习Redis的更多相关文章
- 13.生产环境中的 redis 是怎么部署的?
作者:中华石杉 面试题 生产环境中的 redis 是怎么部署的? 面试官心理分析 看看你了解不了解你们公司的 redis 生产集群的部署架构,如果你不了解,那么确实你就很失职了,你的 redis 是主 ...
- 生产环境中的 redis 是怎么部署的
redis cluster,10 台机器,5 台机器部署了 redis 主实例,另外 5 台机器部署了 redis 的从实例,每个主实例挂了一个从实例,5 个节点对外提供读写服务,每个节点的读写高峰q ...
- 面试系列20 生产环境中的redis是怎么部署的
redis cluster,10台机器,5台机器部署了redis主实例,另外5台机器部署了redis的从实例,每个主实例挂了一个从实例,5个节点对外提供读写服务,每个节点的读写高峰qps可能可以达到每 ...
- 生产环境中的redis是怎么部署的?
redis cluster,10台机器,5台机器部署了redis主实例,另外5台机器部署了redis的从实例,每个主实例挂了一个从实例,5个节点对外提供读写服务,每个节点的读写高峰qps可能可以达到每 ...
- 生产环境中使用Docker Swarm的一些建议
译者按: 实践中会发现,生产环境中使用单个Docker节点是远远不够的,搭建Docker集群势在必行.然而,面对Kubernetes, Mesos以及Swarm等众多容器集群系统,我们该如何选择呢?它 ...
- Kubernetes 在生产环境中常用架构
Kubernetes 在生产环境中常用架构 首先,我们来梳理下Kubernetes生产架构,其设计适用于绝大多数环境.如下图所示 在该架构中,我们可以将其分为四层,如下: Client层:即Kuber ...
- Kubernetes用户指南(三)--在生产环境中使用Pod来工作、管理部署
一.在生产环境中使用Pod来工作 本节将介绍一些在生产环境中运行应用非常有用的功能. 1.持久化存储 容器的文件系统只有当容器正常运行时有效,一旦容器奔溃或者重启,所有对文件系统的修改将会丢失,从一个 ...
- 生产环境中 Ngx_lua 使用技巧和应用的范例
生产环境中 Ngx_lua 使用技巧和应用的范例 时间 -- :: 51CTO技术博客 原文 http://rfyiamcool.blog.51cto.com/1030776/1252501 主题 L ...
- Flink 实战:如何解决生产环境中的技术难题?
大数据作为未来技术的基石已成为国家基础性战略资源,挖掘数据无穷潜力,将算力推至极致是整个社会面临的挑战与难题. Apache Flink 作为业界公认为最好的流计算引擎,不仅仅局限于做流处理,而是一套 ...
随机推荐
- redis与python交互
import redis #连接 r=redis.StrictRedis(host="localhost",port=6379,password="sunck" ...
- 【BZOJ 5222】[Lydsy2017省队十连测]怪题
题目大意: 传送门 给一个长度为$n(n<=200)$的数列$h$,再给$m$个可以无限使用的操作,第$i$个操作为给长度为花费$c_i$的价值给长度为$l_i$的数列子序列+1或-1,求将数列 ...
- Android圆形头像,拍照后“无法加载此图片”的问题解决(适配Android7.0)
Feature: 点击选择拍照或者打开相册,选取图片进行裁剪最后设置为圆形头像. Problem: 拍好照片,点击裁剪,弹Toast"无法加载此图片". Solution: 在裁剪 ...
- Python数据结构应用4——搜索(search)
Search是数据结构中最基础的应用之一了,在python中,search有一个非常简单的方法如下: 15 in [3,5,4,1,76] False 不过这只是search的一种形式,下面列出多种形 ...
- 再不了解PostgreSQL,你就晚了之PostgreSQL主从流复制部署
前言 在MySQL被收购之后,虽然有其替代品为: MariaDB,但是总感觉心里有点膈应.大家发现了另一款开源的数据库: PostgreSQL. 虽然centos自带版本9.2也可以用,但是最近的几次 ...
- mybatis 增加热加载xml
由于在本地开发环境上每次修改mybatis xml文件都需要手动重启服务,调试的很麻烦,所以需要热加载xml文件来避免浪费时间,于是网上搜一下资料,看了下有一大堆,但试了下真正能跑起来没有(大都代码没 ...
- DataFrameNaFunctions无fill方法
当我使用 spark2.1 ,为了填补 dataframe 里面的 null 值转换为 0 ,代码如下所示: dataframe.na.fill(0) 出现如下错误 Spark version 2.1 ...
- Java:并发不易,先学会用
我从事Java编程已经11年了,绝对是个老兵:但对于Java并发编程,我只能算是个新兵蛋子.我说这话估计要遭到某些高手的冷嘲热讽,但我并不感到害怕. 因为我知道,每年都会有很多很多的新人要加入Java ...
- 你真的了解字典(Dictionary)吗?
从一道亲身经历的面试题说起 半年前,我参加我现在所在公司的面试,面试官给了一道题,说有一个Y形的链表,知道起始节点,找出交叉节点. 为了便于描述,我把上面的那条线路称为线路1,下面的称为线路2. 思路 ...
- 关于.net导出数据到excel/word【占位符替换】
1]excel的占位符替换 效果如图 关键代码: ///savedFilePath需要保存的路径 templateDocPath模板路径 替换的关键字和值 格式 [姓名]$%$小王 public st ...