Flashduty 案例分享 - 益丰大药房
Flashduty 作为功能完备的事件OnCall中心,可以接入云上、云下不同监控系统,统一做告警降噪分派、认领升级、排班协同,已经得到众多先进企业的认可。我们采访了一些典型客户代表,了解他们的痛点、选型考虑和未来展望,集成本系列文章,以飨读者。
本次采访的是来自益丰大药房的高级运维工程师张望。益丰大药房是一家连锁零售药房企业,有上万家门店,官网是https://www.yfdyf.com/,已于主板上市,股票代码:603939,颇具规模。

Question:张望老师您好,请问在选择 Flashduty 之前,贵司是如何做告警事件管理和触达的呢?
Answer:我们内部有多套不同的监控系统,用于机器和网络设备监控的 Zabbix,用于中间件和应用监控的 Prometheus + Nightingale,同时也使用了多家云厂商的云监控,用于云资源的监控。
不同的监控系统都会发出告警,但是缺少了统一的告警聚合降噪、认领升级能力,Zabbix、Prometheus、Nightingale 我们主要发企微告警,云监控主要打电话发短信。因为主要告警消息在企微群里,缺少比较好的认领机制,有时告警不能及时处理酿成故障,这是我们之前的主要痛点。
另外就是有时会短期触发特别多告警出来,而且是不同监控系统产生,重要的不重要的告警混杂在一长串的企微消息里,看起来费劲,也容易忽略重要告警。这多个监控系统中,Prometheus 生态的 Alertmanager 会有一定的降噪能力,但是需要维护 yaml 配置,容易出错,不方便管理,整体就感觉比较苦恼。
Question:您内部的告警事件现在都迁移到 Flashduty 了么?目前效果如何?是否有一些建议给我们?
Answer:是的,主要监控系统的告警事件都推到 Flashduty 了。目前整体效果还不错。上次我们大数据团队提的那个需求,希望在推告警事件给 Flashduty 时,携带一些自定义的通知人和升级逻辑,我看你们也抽象为产品能力支持了,大数据团队负责人钱哥也表示效果符合预期。
Question:您在调研事件 OnCall 产品时应该也看过其他竞品,最终选择 Flashduty 的原因可否分享一二?
Answer:是的,因为公司要求必须要对比多家产品,我们深度调研了两个产品,另外也考虑自研,整体算是三个方案一起决策。自研的话比较可控,就是担心人员流动之后后面留下烂摊子,另外事件中心不是我们的核心业务产品方向,我们主要是做药房生意的,这类辅助类功能,老板也不愿意投入过多人力。外采的产品性价比还可以,所以最终决定外采。
对比市面上的产品之后最终选择 Flashduty,主要是感觉你们的 UI 还挺现代化的,告警分派、认领升级也比较灵活,对我们是够用了。另外大数据团队提的需求你们响应很及时,这也是个加分项。
另外我们也在用 Nightingale,之前也做过一些交流,感觉你们在监控告警这块比较专业,这也是一个小的加分项。
Question:感谢张望老师,对于后面的产品方向和合作方面,您是否有一些建议给到我们呢?
Answer:我们内部同事聊天的时候,普遍觉得你们有个优点可以保持下去,就是愿意随着客户一起迭代、一起成长。其实我们团队在公司内部也做了很多年监控了,也还是会间歇性有一些新需求新想法,一个系统没法说一旦落地就永远不动了。能够不断迭代,持续优化产品,能够持续支持客户的业务发展、支持客户的新想法落地,我觉得非常关键,这一点希望你们可以保持下去。
关于Flashduty
️ Flashduty 中心化告警处理,在正确的时间通知正确的人


每一分钟都很关键,降低故障时间,就是赚钱



️ 您常用的监控系统,我们都可以集成

告警事件的及时处理,对于线上稳定性保障至关重要。一款中心式的告警事件 OnCall 中心,去除告警风暴,确保告警不遗漏,还能分析故障处理的MTTA、MTTR等效率指标,先进的团队需要拥有,快来免费体验吧:https://flashcat.cloud/product/flashduty/
Flashduty 案例分享 - 益丰大药房的更多相关文章
- 老李案例分享:Weblogic性能优化案例
老李案例分享:Weblogic性能优化案例 POPTEST的测试技术交流qq群:450192312 网站应用首页大小在130K左右,在之前的测试过程中,其百用户并发的平均响应能力在6.5秒,性能优化后 ...
- 性能调优案例分享:Mysql的cpu过高
性能调优案例分享:Mysql的cpu过高 问题:一个系统,Mysql数据库,数据量变大之后.mysql的cpu占用率很高,一个测试端访问服务器时mysql的cpu占用率为15% ,6个测试端连服务 ...
- [转载]DevOps在传统企业的落地实践及案例分享
内容来源:2017年6月10日,优维科技高级解决方案架构师黄星玲在“DevOps&SRE 超越传统运维之道”进行<DevOps在传统企业的落地实践及案例分享>演讲分享.IT 大咖说 ...
- mysql的"双1设置"-数据安全的关键参数(案例分享)
mysql的"双1验证"指的是innodb_flush_log_at_trx_commit和sync_binlog两个参数设置,这两个是是控制MySQL 磁盘写入策略以及数据安全性 ...
- MySQL数据库详解之"双1设置"的数据安全的关键参数案例分享
mysql的"双1验证"指的是innodb_flush_log_at_trx_commit和sync_binlog两个参数设置,这两个是是控制MySQL 磁盘写入策略以及数据安全性 ...
- 前端案例分享(一):CSS+JS实现流星雨动画
目录 引言 1.效果图 2.源码 3.案例解析 4.小问题 5.结语 引言 平常会做一些有意思的小案例练手,通常都会发到codepen上,但是codepen不能写分析. 所 ...
- 易普优APS高级计划排程系统系列提纲:行业知识,业务建模,排程算法,计划可视化,平台框架,案例分享
专注于高级计划排程系统研发与实施10来年了,国内外各种APS软件基本都研究过,这里列个提纲主要从6个方面跟大家一起讨论分享,欢迎大家鼓掌或拍砖 易普优APS高级计划排程系统系列001:行业知识,APS ...
- CODING 携手 Thoughtworks 助力老百姓大药房打造”自治、自决、自动”的敏捷文化
老百姓大药房是中国具有影响力的药品零售连锁企业,中国药品零售企业综合竞争力百强冠军.中国服务业 500 强企业.湖南省百强企业. 自 2001 年创立以来,现已成功开发了湖南. 陕西.浙江.江苏等 * ...
- Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享) 常用的两款AI可视化交互应用比较: Gradio Gradio的优势在于易用性,代码结构相比Str ...
- ArcGIS Add-in插件开发从0到1及实际案例分享
同学做毕设,要求我帮着写个ArcGIS插件,实现功能为:遍历所有图斑,提取相邻图斑的公共边长及其他属性(包括相邻图斑的ID),链接到属性表中.搞定后在这里做个记录.本文分两大部分: ArcGIS插件开 ...
随机推荐
- 全面升级!揭秘阿里云智能Logo设计的AI黑科技
简介: 免费体验!阿里云智能logo设计一直致力于用AI技术,帮助更多有设计需求的朋友能"多快好省"地做logo,让"设计logo"这件有门槛的事情,通过智能工 ...
- [FAQ] Argument 3 passed to Lcobucci\JWT\Signer\Hmac::doVerify() must be an instance of Lcobucci\JWT\Signer\Key, null given
出现这个错误,说明没有找到 key,在使用 laravel-jwt 之前需要生成加密 key,使用: $ php artisan jwt:secret Link:https://www.cnblogs ...
- dotnet 是否应该对 HttpResponseMessage 调用 Dispose 进行释放
对于 HttpClient 的请求响应值 HttpResponseMessage 来说,既然继承了 IDisposable 接口,自然就是想让大家可以通过 using 或者手动调用 Dispose 进 ...
- nginx+uwsgi介绍
一.nginx+uwsgi介绍 pip list # 查看安装过的模块 rpm -q nginx # 查看是否安装某款服务 pip install django == 1.11.11 # 安装djan ...
- vue3 快速入门系列 —— 状态管理 pinia
其他章节请看: vue3 快速入门 系列 pinia vue3 状态管理这里选择 pinia. 虽然 vuex4 已支持 Vue 3 的 Composition API,但是 vue3 官网推荐新的应 ...
- pde复习笔记 第一章 波动方程 第六节 能量不等式、波动方程解的唯一性和稳定性
能量不等式 这一部分需要知道的是能量的表达式 \[E(t)=\int_{0}^{l}u_{t}^{2}+a^{2}u_{x}^{2} dx \] 一般而言题目常见的问法是证明能量是减少的,也就是我们需 ...
- SpringBoot3.1.5对应新版本SpringCloud开发(2)-Eureka的负载均衡
Eureka的负载均衡 负载均衡原理 负载均衡流程 老版本流程介绍 当order-servic发起的请求进入Ribbon后会被LoadBalancerInterceptor负载均衡拦截器拦截,拦截器获 ...
- surging版本有哪些?
surging 一直在升级开发各个版本,以下是各个版本的费用,有需要可以联系或者可以聘请我为架构师,技术顾问,后期会升级多语言版本,推广至海外. 基于surging 的物联网技术架构 平台版本:
- 安装pyenv-win(windows 环境)支持多个python环境管理
安装pyenv-win(windows 环境)支持多个python环境管理 https://blog.csdn.net/dair6/article/details/129128240
- AI 编译器CINN中的OpLowering优化Pass
一.Lower 主逻辑 在 OpLower::Lower() 接口中,主要分为两大类: Elementwise类,主要涉及的 OpPattern 包括:kElementwise .kBroadcast ...