简介:数字化安全生产平台则帮助客户促进业务与 IT 的全面协同,从业务集中监控、业务流程管理、应急指挥响应等多维度来帮助客户建立完善专业的业务连续性保障体系。

作者:银桑、比扬

阿里云创立于 2009 年,是全球领先的云计算及人工智能科技公司。阿里云为 200 多个国家和地区的企业、公共机构和开发者,提供安全、可靠的云计算、大数据、人工智能等产品和服务。阿里云作为全国首家云等保试点示范平台和首家通过国家等保四级备案测评的云服务商,为中国超过一半的上市公司,为 80%中国科技创新企业提供云计算服务。

众所周知,阿里巴巴双 11 是对业务来说是一个独一无二的挑战。在大促期间,集群规模超过百万,单集群规模达到 10000 以上。2019 年双 11 的数据库峰值能力达到 54.5 万笔订单每秒,数据库 TPS 达到 8700 万,实时计算 Blink 处理峰值达到 25 亿消息每秒,消息系统峰值达到 1.5 亿消息每秒。这些数值是对业务的极致性能和极致稳定性的要求,其中的业务稳定性离不开全面的高可用架构和手段来保障。阿里云在海量互联网服务以及历年双 11 场景的实践过程中,沉淀出了包括全链路压测、线上流量管控、故障演练、多活容灾和安全生产等高可用核心技术,并通过开源和云上云下服务的形式对外输出,以帮助企业用户和开发者享受技术红利,提升系统稳定性和业务连续性。

图 1:企业数字化安全生产解决方案:阿里巴巴业务连续性实践

数字化安全生产平台(Digital Production Stability,简称 DPS)核心面向 1-5-10 应急响应场景,提供应急事件和故障的发现、响应和处理,提供应急场景的定义与管理、故障监控布防、故障上报、故障应急协同、故障过程跟踪、故障恢复、改进措施的全生命周期管理能力。帮助客户提升业务稳定性,为客户提供故障应急场景下的一站式服务。

如今,云原生已经成为企业数字化转型的关键策略,由于应用需要快速开发和交付,这就促使企业采用云原生的方法来开发应用,以提高效率,并增加灵活性。对于身处云原生时代的企业和开发者而言,不仅需要采用云原生的手段来应对业务的高速迭代,更要关注业可用及连续性管理建设。数字化安全生产平台则帮助客户促进业务与 IT 的全面协同,从业务集中监控、业务流程管理、应急指挥响应等多维度来帮助客户建立完善专业的业务连续性保障体系。

数字化安全生产平台核心面向业务连续性管理,围绕业务提供风险预警、决策支撑、指挥调度和组织运营四大板块能力,同时每个板块由多个能力域共同组成,通过具体的业务场景(如 1-5-10 应急响应)串联整个业务流程。

  • 风险预警。通过监控中心、事件中心两大核心能力,提供基础设施、业务应用的实时监控信息,配合应急场景定义、监控项关联、事件响应与处理、ChatOps 协同等能力,为客户业务提供实时监控告警和风险通告,实时了解业务的运行情况。
  • 决策支撑。通过根因定位、智能分析和日志中心三大核心能力,在业务出现告警事件甚至故障的情况下,提供丰富的定位手段和数据来支撑业务变更决策。支持业务的智能巡检,指标关联类、调用异常类的根因定位;支持数据库调用、接口调用、应用性能和调用链的分析与查询。同时也支持多种日志类型采集与分析,从日志中查询业务运行情况。
  • 指挥调度。当业务告警事件或者故障需要面临变更时,通过与高可用产品的深度集成,提供丰富的变更处理手段来应对业务变更。流量防护提供应用防护和网关防护能力,可以配置多种流控规则来应对大流量或者服务不稳定调用的场景;开关预案提供快速的、有计划的变更处理。
  • 组织运营。业务的连续性管理不仅仅是保障应用的高可用,更多是业务人员的应急协同,从而为客户打造 SRE 型组织。平台提供组织协同管理、工单、知识库等能力,帮助客户将运维人员和业务应用通过流程化的方式进行协同管理,应急响应责任到人,通过工单、事件单和演练评测的方式等方式实现组织协同。

原文链接

本文为阿里云原创内容,未经允许不得转载。

阿里云数字化安全生产平台 DPS V1.0 正式发布!的更多相关文章

  1. 通过阿里云的IOT平台控制ESP8266

    通过阿里云的IOT平台控制ESP8266 #include <ESP8266WiFi.h> /* 依赖 PubSubClient 2.4.0 */ #include <PubSubC ...

  2. 2019 GNTC 阿里云参会分享:开放、弹性的阿里云网络NFV平台

    作为全球规模最大的网络技术盛会之一,GNTC全球网络技术大会是网络技术发展的重要风向标,包含战略规划.产业方向.技术趋势.应用创新等皆汇集于此.而作为云服务商代表,阿里云再度受邀以顶级钻石合作伙伴之名 ...

  3. 坚守安全第一准则!阿里云接连通过等保2.0测评、ISO国际认证

    斩获新资质 数字时代,数据的安全对于互联网用户来说显得尤为重要.阿里云更是一直坚持“安全第一准则”,致力于为客户的数据安全搭建更健全机制. 2019年5月,阿里云“电子政务云平台系统”正式通过网络安全 ...

  4. RDIFramework.NET平台代码生成器V1.0发布(提供下载)

    RDIFramework.NET平台代码生成器V1.0发布(提供下载)   RDIFramework.NET(.NET快速开发整合框架)框架做为信息化系统快速开发.整合的框架,其目的一至是给用户和开发 ...

  5. 阿里云CentOS自动备份MySql 8.0并上传至七牛云

    本文主要介绍一下阿里云CentOS7下如何对MySql 8.0数据库进行自动备份,并使用.NET Core 将备份文件上传至七牛云存储上,并对整个过程所踩的坑加以记录. 环境.工具.准备工作 服务器: ...

  6. 自动化测试管理平台ATMS(V1.0.1_7.29)下载

    自动化测试管理平台ATMS(V1.0.1_7.29)下载http://automationqa.com/forum.php?mod=viewthread&tid=2582&fromui ...

  7. 阿里云移动研发平台 EMAS 助力银行业打造测试中台,提升发版效能

    随着移动互联网的发展,手机银行凭借低成本.操作简单.不受时间空间约束等优势,正逐步替代传统的网银交易方式.越来越多的银行开始了“业务移动化”转型之路,“手机APP”已经成为企业价值传递和关系维护的关键 ...

  8. 本地 vs. 云:大数据厮杀的最终幸存者会是谁?— InfoQ专访阿里云智能通用计算平台负责人关涛

    摘要: 本地大数据服务是否进入消失倒计时?云平台大数据服务最终到底会趋向多云.混合云还是单一公有云?集群规模增大,上云成本将难以承受是误区还是事实?InfoQ 将就上述问题对阿里云智能通用计算平台负责 ...

  9. 【小程序案例】支付宝小程序-MQTT模器,IoT设备通过WSS接入阿里云IoT物联网平台

    支付宝小程序-MQTT模拟器通过WSS接入阿里云IoT物联网平台 小程序效果: 1. 准备工作 1.1 注册阿里云账号 开通阿里云账号,并通过支付宝实名认证 https://www.aliyun.co ...

  10. 重大升级!灵雀云发布全栈云原生开放平台ACP 3.0

    云原生技术的发展正在改变全球软件业的格局,随着云原生技术生态体系的日趋完善,灵雀云的云原生平台也进入了成熟阶段.近日,灵雀云发布重大产品升级,推出全栈云原生开放平台ACP 3.0.作为面向企业级用户的 ...

随机推荐

  1. Jenkins 批量修改Job的配置

    登录Jenkins机器,执行 以下shell 脚本 --单文件替换 sed -i "s#xxxxx#xxxxxx#g" /var/lib/docker/volumes/jenkin ...

  2. linux下几种快速清空文件内容的方法

    [root@iamzken ~] : > filename [root@iamzken ~] > filename [root@iamzken ~] echo "" & ...

  3. 记录--使用 JS 实现基本的截图功能

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 思路分析 在开始动手之前,分析一下整个功能的实现过程: 根据图片大小创建 canvas1 画布,并将原图片直接定位在 canvas1 上: ...

  4. Ficow 陪你看 WWDC 2022

    本文首发于 Ficow Shen's Blog,原文地址: WWDC22 - Xcode 14 新特性. 内容概览 前言 用好过滤器 Recap,节约你的宝贵时间 Essential,取其精华 必看内 ...

  5. 性能测试系列:Oracle数据库awr报告使用与分析

    一 AWR报告生成 1.生成AWR(Automatic Workload Repository)报告:sqlplus / as sysdbaSQL>@?/rdbms/admin/awrrpt.s ...

  6. Java实现软件设计模式---抽象工厂模式(性别产品等级结构肤色产品族)

    一.题目要求 二.画出对应的类图 三.文件目录结构 四.具体实现代码 Black.java 1 package com.a004; 2 3 public class Black implements ...

  7. 测试开发之系统篇-Docker容器安装

    前面文章我们讲到,容器是运行在宿主机上的一个进程,多个容器之间使用同一个宿主机上的操作系统内核.此处以Ubuntu20.04系统为例,介绍Docker容器引擎的安装过程. 安装 安装依赖. sudo ...

  8. 花式栈溢出 CTFshowpwn88

    花式栈溢出 在这之前确实对这方面了解很少,一般这种花式栈溢出不仅仅要求你能发现漏洞,最主要的是你要有随机应变的能力 这个题是一个64位的题目看一下保护 canary 和 nx保护都开了,我们用ida打 ...

  9. 密码学系列之:SAFER

    密码学系列之:SAFER 简介 分组密码是一个非常优秀的加密结构,很多常用加的加密算法使用的都是分组算法,比如DES.SAFER表示的也是一种分组密码算法.一起来看看吧. SAFER简介 SAFER的 ...

  10. Makefile 常用命令详解

    在软件开发中,Makefile是一种非常常用的自动化工具.Makefile文件包含了一系列规则,用于编译.打包.测试等操作,可以帮助我们自动化这些操作,提高项目的管理和编译效率.本文将介绍Makefi ...