简介:SysOM集监控、告警、诊断、修复、安全能力于一体的操作系统运维平台。

文/系统运维 SIG

如果你被突如其来的 OOPS 和满屏奇怪的函数弄得满头问号?机器内存明明很大,却申请不出来内存?业务周期抖动,ping 命令偶尔时间很长,但无从下手?程序就这么几行但程序怎么跑 CPU 都跑不高,业务流量上不去?亦或是 CPU 使用率 90% 以上,ps 一下一堆乱七八糟的任务导致你不知如何取舍……

当你试图去社区寻找运维的开源产品时,将彻底从 Linux 免费、美味的天堂掉进地狱,因为你将搜索到的是一堆专业、重复甚至互相冲突的命令以及千篇一律的监控系统。这些命令你看不懂,监控系统也仅仅都是些监控 CPU 使用率、内存使用率、网络吞吐的面板, 根本无法解决你的问题,还有 Linux 的低前期投入,带来的是极高的运维成本。

因此,SysOM 来了, SysOM ( System Operation&Maintenance)是由龙蜥社区系统运维 SIG 打造的一站式操作系统运维平台,融入了 SIG 成员的成功商用运维实践经验,能够帮助用户在统一平台上实现主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。

SysOM 诞生主要是为了解决以下各方面的问题:

  • Linux 社区存在大量的运维管理工具、监控工具、诊断工具,但是工具碎片化严重,单个工具解决单个场景问题,需要用户花费大量时间研究该工具才能使用,没有统一的平台为用户提供好的操作系统运维体验
  • 操作系统作为非常底层的基础设施,运维难度大,宕机问题、内存问题、网络问题等各类疑难问题的分析都需要非常专业的操作系统知识,对于一般运维人员入门门槛过高
  • 一般的开源操作系统都有提供软件安全更新,但是却没有运维平台来统一管理安全漏洞的影响范围、漏洞的发现、漏洞的修复

基于以上问题,龙蜥社区 SysOM 应运而生,当前 SysOM 提供了以下 4 方面能力:

  • 统一平台:一个平台解决操作系统运维过程中所需要的多种关键能力。SysOM 将主机管理、监控、诊断、审计、修复、安全能力集于一体,通过 Web 化的界面管理方式,用户可以轻松运维所有机器;
  • 简单易用:提供统一监控系统,用户无需配置即可多维度的观测到所管理主机的状态;提供统一的诊断系统,用户用过 Web 化的界面即可完整各类深入的操作系统问题诊断;
  • 深度分析:集成 SysAK 工具集深度诊断解决方案,沉淀百万级的运维经验,进行内核源码级别的问题剖析;
  • 安全可靠:提供统一的安全中心,为用户所管理主机提供全方位的漏洞监控、管理、修复,保障系统的安全性;同时提供各类安全加固能力,满足不同应用不同程度的安全要求。

SysOM 介绍

1、架构介绍

SysOM 整体架构分为:前端展示、服务端分析、客户数据收集。通过统一的前端 Web 将所有运维服务的分析数据展示给用户:

2、功能介绍

SysOM 主题功能包括以下 6 类:

  • 主机管理

作为 SysOM 管控界面,承担管理节点的增删改查、终端操作系统等功能。你可以通过简单的 Web 界面操作将需要管理的机器添加进管理界面,也可以一键登录到对应的机器进行 shell 操作。

  • 监控中心

监控中心主要为用户全方位的展示操作系统情况,包括但不限于:网络延迟、资源使用、任务负载、系统任务等。它将提供类似基于特定场景(如游戏、金融等)的网络抖动监控 Netinfo 功能,也能提供操作系统全方位基础指标监控。

  • 宕机中心

宕机问题作为操作系统异常的一种极端情况,往往会对用户的应用产生重大影响。SysOM 宕机中心将会为用户提供统一的宕机问题管理,包括宕机监控、已知问题管理、在线分析、解决方案等能力。通过多维度的宕机管理,降低宕机问题对用户的影响,提升用户业务的稳定性。

  • 诊断中心

操作系统作为非常底层的软件基础设施,运维难度较高,针对操作系统层面的问题,SysOM 集成了龙蜥社区的 SysAK 能力,为用户提供了全方位的诊断能力,包括:系统健康检查(即一键诊断)、网络/内存/存储/调度深度诊断,通过全方位诊断帮助用户分析操作系统层面的各类问题。

  • 日志中心

日志中心将会为用户提供日志审计的功能,便于管理员监控、管理所负责集群的运维情况。

  • 安全中心

安全问题越来越受到大家的重视,而操作系统包含大量的开源软件包,无时无刻不在产生新的安全漏洞。作为操作系统管理员最关心的是能够及时发现系统中存在的安全漏洞,并能够快速修复。SysOM 安全中心为用户提供实时的安全漏洞检测,同时根据操作系统的修复进展提供白屏修复操作。

使用实践

1、环境准备

操作系统:Anolis OS 8.4 ANCK 64 位 系统规格:2 核 8 g

数量:3台

网络:公网IP

2、SysOM 部署

2.1 监控组件部署

#选择 Server 节点,执行下述命令部署监控组件

#部署目录

mkdir -p /usr/local/sysom/server/monitor/

#下载 grafana + prometheus + node-exporter

#下载 grafana 到 /usr/local/sysom/server/monitor/

wget https://dl.grafana.com/oss/release/grafana-8.2.5-1.x86_64.rpm -P /usr/local/sysom/server/monitor/

#下载 prometheus 到 /usr/local/sysom/server/monitor/

wget https://github.com/prometheus/prometheus/releases/download/v2.29.1/prometheus-2.29.1.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

#下载 node-exporter 到 /usr/local/sysom/server/monitor/

wget https://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

2.2 诊断组件部署

#在 Client 节点,执行下述命令部署监控组件

#如未安装诊断组件,SysOM的诊断中心将无法运行

#部署目录

mkdir -p /usr/local/sysom/server/diagnose

#下载诊断组件 sysAK

wget https://gitee.com/anolis/sysak/attach_files/1011048/download/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm -P /usr/local/sysom/server/diagnose/

#安装 sysAK

rpm -idv /usr/local/sysom/server/diagnose/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm --nodeps

2.3 SysOM 部署

#下载 SysOM

wget https://gitee.com/anolis/sysom/attach_files/1010533/download/sysomRelease-20220329115704.tar.gz -P /usr/local/sysom/

cd /usr/local/sysom/

tar -zxvf sysomRelease-20220329115704.tar.gz

cd sysomRelease-20220329115704

#安装 Sysom。选择前面准备好的机器中的一台作为 SysOM 服务器,如果只有公网 IP,只需要填一样即可(暂不支持离线安装)。

./deploy.sh /usr/local/sysom 内网 IP 公网 IP

3、使用 SysOM

部署成功后,用户就可以通过浏览器访问已部署的 SysOM 平台了。直接在浏览器中输入公网 IP(如果只有内网 IP 也可以用内网 IP)。

3.1 登录界面

3.2 系统界面

3.3 功能使用

本文为 SysOM 系列第一篇,SysOM 功能详细介绍参见后续系列文章,还请持续关注龙蜥公众号不迷路。

原文链接

本文为阿里云原创内容,未经允许不得转载。

龙蜥正式开源 SysOM:百万级实战经验打造!一站式运维管理平台 | 龙蜥技术的更多相关文章

  1. 华为云和开源Istio运维管理对比样例应用部署

    前言 在公有云方面,华为云已经率先将 Istio 作为产品投入到公有云中进行商业应用中,保持和开源istio高度兼容,做了商业化的运维管理界面,同时进行了性能优化.这里我们做一次验证测试. Booki ...

  2. 腾讯万亿级分布式消息中间件TubeMQ正式开源

    TubeMQ是腾讯在2013年自研的分布式消息中间件系统,专注服务大数据场景下海量数据的高性能存储和传输,经过近7年上万亿的海量数据沉淀,目前日均接入量超过25万亿条.较之于众多明星的开源MQ组件,T ...

  3. 如约而至:微信自用的移动端IM网络层跨平台组件库Mars已正式开源

    1.前言 关于微信内部正在使用的网络层封装库Mars开源的消息,1个多月前就已满天飞(参见<微信Mars:微信内部正在使用的网络层封装库,即将开源>),不过微信团队没有失约,微信Mars ...

  4. 【转】如约而至:微信自用的移动端IM网络层跨平台组件库Mars已正式开源

    网上看到关于微信官方的跨平台跨业务的终端基础组件Mars的介绍文章,转载这这里.源代码: https://github.com/Tencent/mars作者:男人链接:https://zhuanlan ...

  5. [NewLife.XCode]实体列表缓存(最土的方法实现百万级性能)

    NewLife.XCode是一个有10多年历史的开源数据中间件,支持nfx/netcore,由新生命团队(2002~2019)开发完成并维护至今,以下简称XCode. 整个系列教程会大量结合示例代码和 ...

  6. Netflix正式开源其API网关Zuul 2

    5 月 21 日,Netflix 在其官方博客上宣布正式开源微服务网关组件 Zuul 2.Netflix 公司是微服务界的楷模,他们有大规模生产级微服务的成功应用案例,也开源了相当多的微服务组件(详见 ...

  7. 数据库SQL优化大总结之 百万级数据库优化方案(转载)

    网上关于SQL优化的教程很多,但是比较杂乱.近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充. 这篇文章我花费了大量的时间查找资料.修改.排版,希望大家阅读之后,感觉 ...

  8. 百万级PHP网站架构工具箱

    在了解过世界最大的PHP站点,Facebook的后台技术后,今天我们来了解一个百万级PHP站点的网站架构:Poppen.de.Poppen.de是德国的一个社交网站,相对Facebook.Flickr ...

  9. mysql 百万级数据库优化方案

    https://blog.csdn.net/Kaitiren/article/details/80307828 一.百万级数据库优化方案 1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 wher ...

  10. 攻克数据库核心技术壁垒,实现百万级QPS的高吞吐

    CynosDB是腾讯云自研的新一代高性能高可用的企业级分布式云数据库.融合了传统数据库.云计算与新硬件的优势,100%兼容开源数据库,百万级QPS的高吞吐,不限存储,价格仅为商用数据库的1/10. C ...

随机推荐

  1. git 修改大小写远程分支失败

    先说原因: windows大小写不敏感导致   最近由于项目需求,改回了windows开发环境,之前一直是 mac 开发环境,结果在windows环境下使用 git 时, 把某个之前大写的文件夹名称改 ...

  2. 05_QT_Mac开发环境搭建

    在不同的Mac环境下,实践出来的效果可能跟本教程会有所差异.我的Mac环境是:Intel CPU.macOS Moterey(12.4). FFmpeg 安装 在Mac环境中,直接使用Homebrew ...

  3. 面试官:volatile如何保证可见性的,具体如何实现?

    写在开头 在之前的几篇博文中,我们都提到了 volatile 关键字,这个单词中文释义为:不稳定的,易挥发的,在Java中代表变量修饰符,用来修饰会被不同线程访问和修改的变量,对于方法,代码块,方法参 ...

  4. RageFrame学习笔记:创建路由+导入layui

    这是我写的学习RageFrame的第二篇,这一篇给大家分享下我是如何创建路由,导入外部js,css文件的,这里写下我的全部流程,希望对大家有所帮助. 话不多说,直接开始,在上一章中,我们已经把项目实例 ...

  5. [Spring]aop的配置与使用

    [版权声明]未经博主同意,谢绝转载!(请尊重原创,博主保留追究权) https://blog.csdn.net/m0_69908381/article/details/129907717 出自[进步* ...

  6. 鸿蒙HarmonyOS实战-ArkUI组件(GridRow/GridCol)

    一.GridRow/GridCol 1.概述 栅格布局是一种通用的辅助定位工具,可以帮助开发人员解决多尺寸多设备的动态布局问题.通过将页面划分为等宽的列数和行数,栅格布局提供了可循的规律性结构,方便开 ...

  7. FBNet/FBNetV2/FBNetV3:Facebook在NAS领域的轻量级网络探索 | 轻量级网络

    FBNet系列是完全基于NAS方法的轻量级网络系列,分析当前搜索方法的缺点,逐步增加创新性改进,FBNet结合了DNAS和资源约束,FBNetV2加入了channel和输入分辨率的搜索,FBNetV3 ...

  8. 下载标准国民经济行业分类与代码GB/T 4754-2011,存入mysql数据库

    戳链接下载:https://download.csdn.net/download/weixin_45556024/34913490 或关注公众号[靠谱杨阅读人生]回复[行业]获取. 整理不易,资源fu ...

  9. #正余弦定理#牛客练习赛71 B 烙印

    题目 将三角形的六要素只留下三个已知条件, 问有多少种情况,多组询问 分析 首先分类讨论一下(对新高一不友好,比如说我). 前置知识: 正弦定理: \[\frac{a}{sinA}=\frac{b}{ ...

  10. 如何在OpenHarmony上使用SeetaFace2人脸识别库?

    简介 相信大部分同学们都已了解或接触过OpenAtom OpenHarmony(以下简称"OpenHarmony")了,但你一定没在OpenHarmony上实现过人脸识别功能,跟着 ...