裴丹:AIOps 智能运维经验分享】的更多相关文章

没有网络安全就没有国家安全,中国作为一个崛起中的大国,网络安全至关重要.新一届中央高度重视信息安全自主可控的发展,Gartner研究报告表明,2019年中国三分之二的数据中心.IT基础设施支出流向中国本土厂商,因此,如智和网管平台SugarNMS以国产化.高拓展性为核心的智能化运维软件成为行业的前沿力量. 自主知识产权 全面深入IT国产化 IT国产化体系复杂,产业链涉及网络基础设施.服务器.存储.数据库.中间件.操作系统等众多环节.现在,服务器.PC和网络安全国产化率较高,如服务器领域依靠华为.…
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 作为企业智能运维门户,业界早已关注织云的智能运维体系.我们很荣幸地宣布织云 Metis 智能运维体系正式发布.自此,织云家族已发布:织云企业版,织云社区版(Lite),织云 Metis 智能运维.企业版和社区版区别请戳. Metis 是腾讯内部落地实践的智能运维场景的集合,具备多种核心能力,如智能监控.智能分析.智能决策等.这些核心能力已在多元化.多样化的运维场景中得到落地实践.Metis 是从腾讯QQ.Qzone 等海量业务的一体化运…
从马车到汽车是为了提升运输效率,而随着时代的发展,如今我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,增加运行效率,同时也可减少交通事故发生率,这也是企业对于智能运维的诉求. 从人工运维到自动化运维是为了减少人力成本,降低操作风险,提高运维效率,但自动化运维的本质依然是人与自动化工具相结合的运维模式,仍有局限性.为了持续地面向大规模.高复杂性的系统提供高质量的运维服务,智能运维(AIOps)应运而生. 本文,袋鼠云将跟大家分享智能运维大数据平台(一款开箱即用的运维监控平台)在Oracl…
编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电子书,了解阿里十年DevOps实践经验. 阿里巴巴的运维团队致力于打造无人值守的运维平台,用智能化推动高效率.低成本的应用运维.智能运维是运维平台实现信息化和数字化之后的自然发展,利用扎实的技术基础,把机器学习.优化算法和各个专业领域方面的知识完美结合起来,针对具体运维场景提供令人满意的解决方案. 智能运维(…
分享嘉宾:管正雄 阿里云 高级算法工程师 出品平台:DataFunTalk 导读:面对海量的用户问题,有限的支持人员该如何高效服务好用户?智能QA生成模型给业务带来的提效以及如何高效地构建算法服务,为业务提供支持.本文将介绍:阿里云计算平台大数据产品答疑场景:基于达摩院AliceMind预训练模型实现的智能QA生成算法核心能力及背后实现原理:如何通过智能运维服务平台将算法能力输出,给业务提供一站式服务,优化答疑体验.主要分为以下几部分: 背景介绍 QA生成框架 QA生成在业务场景中的应用 总结与…
http://www.qconbeijing.com/download/Nicolas.pdf 重点看了下facebook做了哪些改进以及他们的运维经验,比较重要的有以下几点: 改进: 1 加强了行级的ACID约束 2 改善了数据的分布规则,可以配置hdfs的replicas所在节点 3 改写了master的assign规则,利用zk来进行assign 4 不用停机地重启cluster 5 改进了compaction策略 6 批量查询的优化 7 对压缩进行了改进 运维经验: 1 事先切分好的re…
运维老鸟分享linux运维发展路线规划 linux 运维发展路线常见的就是下面两条路线: 第一条:运维应用-->系统架构-->运维开发-->系统开发 第二条:运维应用-->应用dba-->架构dba-->开发DBA 下面详细每个阶段的职位说明(以北上广为例): 01.运维应用级别: 这个阶段就是玩别人的软件,例如:linux.nginx.mysql.php.nagios 大多数的 linux 运维工程师,网络工程师,系统工程师都是这个阶段. 这个阶段的工资平均 3-10…
一个兼职DBA的数据库运维经验 小米科技  xx@xiaomi.com 2011 内存扩容 16G->64G ,调大bp后,凌晨说监控物理内存有余量情况下,开吃swap,内存泄露措施1  定时 echo 1 >/proc/sys/vm/drop_caches  页面缓存措施2 下次mysql实例重启期间,numactl --interleave=all  mysqld &  启动mysql时候关闭numa特性 ulimit允许coreulimit -c  最大的core文件大小,以bl…
1.开发经验总结  ——12 Sep 2014 · 8 revisions 在jstorm中, spout中nextTuple和ack/fail运行在不同的线程中, 从而鼓励用户在nextTuple里面执行block的操作, 原生的storm,nextTuple和ack/fail在同一个线程,不允许nextTuple/ack/fail执行任何block的操作,否则就会出现数据超时,但带来的问题是,当没有数据时, 整个spout就不停的在空跑,极大的浪费了cpu, 因此,jstorm更改了stor…
转自:http://www.juvenxu.com/2015/03/20/experiences-on-zookeeper-ops/ ZooKeeper 运维经验 ZooKeeper 是分布式环境下非常重要的一个中间件,可以完成动态配置推送.分布式 Leader 选举.分布式锁等功能.在运维 AliExpress ZooKeeper 服务的一年多来,积累如下经验: 1. 集群数量 3台起,如果是虚拟机,必须分散在不同的宿主机上,以实现容灾的目的.如果长远来看(如2-3年)需求会持续增长,可以直接…