【导语】:Netdata 是一个开源、免费、预配置、高灵敏度的分布式实时监控系统。

简介

Netdata的分布式实时监视代理以零配置的方式,从系统、硬件、容器和应用程序收集数千个指标,它可以运行在所有的物理或虚拟服务器、容器、云和IoT设备上,可以在大多数Linux发行版(Ubuntu,Debian,CentOS等),容器平台(Kubernetes集群,Docker)和许多其他操作系统(FreeBSD,macOS)上安装,不需要sudo权限。

Netdata由系统管理员,DevOps工程师和开发人员设计,旨在收集所有内容,可视化监控指标,解决复杂的性能问题。

Netdata究竟怎么样?来看看用过的人是怎么说的:

  • 无限指标:Netdata收集所有可用指标-越多越好
  • CPU利用率:极低的CPU占用率,优化到极致的性能
  • 内存占用:高效的数据库引擎将每秒的指标存储在内存中,然后将历史指标保存到磁盘
  • 磁盘I/O:运行时,Netdata仅写入历史指标,并读取error和access记录日志,减少磁盘I/O
  • 零配置:Netdata可以自动检测所有内容,并且可以立即为每台服务器收集10,000个指标
  • 零维护:启动运行之后就可以不用管,Netdata负责剩余的工作
  • 快速交互式可视化:仪表板对每个指标的查询响应时间不到1毫秒,可在用户平移时间,放大异常等的同时同步图表
  • 异常检测:强调图表之间的关系,以帮助用户检测异常的根本原因
  • 可扩展:可以将其安装在所有服务器,容器,VM和IoT设备上。默认情况下,度量标准不是集中式的,因此没有限制
  • 多操作模式:在所有可能的配置中,自主主机监视(默认设置),无头数据收集器,转发代理,存储和转发代理,中央多主机监视。每个节点使用不同的指标保留策略,并在运行状况监视或不运行状况监视的情况下运行
  • 与多应用的组合兼容:可收集300+个系统、容器和应用程序端点指标(APM、容器Docker、数据库MySQL等),将监视程序警告发送到20+个通知平台(Amazon SNS、Email、Syslog等),采样指标支持导出到30+个时序数据库(InfluxDB、Kafka、TiKV等),以实现互操作性

项目地址是:

https://github.com/netdata/netdata

下载安装

  • 源码安装:要在大多数Linux系统(物理、虚拟、容器、IoT)上从源代码安装Netdata,可运行单行安装脚本。该脚本下载并构建所有依赖关系,包括选择连接到Netdata Cloud所需的所有依赖关系,并启用每晚自动更新和匿名统计信息。
bash <(curl -Ss https://my-netdata.io/kickstart.sh)

访问http://localhost:19999或http://NODE:19999

  • Docker
docker run -d --name=netdata \
  -p 19999:19999 \
  -v netdataconfig:/etc/netdata \
  -v netdatalib:/var/lib/netdata \
  -v netdatacache:/var/cache/netdata \
  -v /etc/passwd:/host/etc/passwd:ro \
  -v /etc/group:/host/etc/group:ro \
  -v /proc:/host/proc:ro \
  -v /sys:/host/sys:ro \
  -v /etc/os-release:/host/etc/os-release:ro \
  --restart unless-stopped \
  --cap-add SYS_PTRACE \
  --security-opt apparmor=unconfined \
  netdata/netdata
  • 其他系统安装请自行查看官方文档,包括Kubernetes,deb/rpm安装包等。

工作机制

    • Netdata是一个高效、高度模块化、低延迟的指标管理引擎。它的无锁设计使其非常适合度量标准上的并发操作。

    • Netdata功能和体系结构的高级概述

运维工具之Netdata的更多相关文章

  1. CheungSSH国产自动化运维工具开源Web界面

    CheungSSH web2.0 发布文档 CheungSSH 简介 CheungSSH是一款国人自主研发的Linux运维自动化管理服务器软件,秉着为企业降低运营成本,解放管理员双手和自动化生产的理念 ...

  2. 自动化运维工具Ansible详细部署 (转载)

    自动化运维工具Ansible详细部署 标签:ansible 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://sofar.blog. ...

  3. 【运维工具】Git代码发布系统

    引言 代码发布系统是互联网公司必备的运维系统,作用主要用户发布业务代码 到 业务服务器 为什么需要代码发布系统 有的同学可能说,我们公司服务器就那么一台,做个发布系统太麻烦了? 不认同这说法 发布系统 ...

  4. Python自动化运维工具fabric的安装

    使用shell命令进行复杂的运维时,代码往往变得复杂难懂,而使用python脚本语言来编写运维程序,就相当于开发普通的应用一样,所以维护和扩展都比较简单,更重要的是python运维工具fabric能自 ...

  5. distri.lua的web运维工具

    我的新手游项目很快就要进入到寻找发行商的环节,最近几天相对较空闲,逐将工作重心转移到服务器组运维工具的制作上. 回想一年之前经历的那个不算成功的端游项目,因为运维工具设计得不合理,使用十分不方便,游戏 ...

  6. 自动化运维工具之 Ansible 介绍及安装使用

    一.初识Ansible 介绍: Absible 使用 模块(Modules)来定义配置任务.模块可以用标准脚本语言(Python,Bash,Ruby,等等)编写,这是一个很好的做法,使每个模块幂等.A ...

  7. 【运维工具】logrotate 日志管理神器

    服务器经常会产生各种各样的日志文件,我们需要定期清理 日志的分类 系统日志 应用日志 系统日志 例如系统的history 历史信息   crontab的运行日志  一般系统日志系统都帮我们运维好了,不 ...

  8. 自动化运维工具之ansible

    自动化运维工具之ansible   一,ansible简介 ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet.cfengine.chef.func.fab ...

  9. 自动化运维工具Ansible详细部署 - 人生理想在于坚持不懈 - 51CTO技术博客

    自动化运维工具Ansible详细部署 - 人生理想在于坚持不懈 - 51CTO技术博客 自动化运维工具Ansible详细部署

  10. 用自动化运维工具解放IT运维

    何谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行.这应该是所有业务系统运维终极目标. 我们对运维的要求通常是: 1.事前预警 在故障出现之前,管理人 ...

随机推荐

  1. 登录Harbor仓库报错:Error response from daemon: Get

    登录Harbor仓库报错: docker login -u admin -p Harbor12345 20.20.10.162 WARNING! Using --password via the CL ...

  2. JS常见的API扩展形式(prototype、jquery、vue插件封装)以及怎样设计出易扩展的表单验证功能?

    常见的API扩展形式 prototype 比如我现在有一个需求,给定一个字符串,给方法传递一个参数为数字类型来确定当前字符串重复次数,例如: 'abc'.repeatStringNumTimes(3) ...

  3. 人脸伪造图像检测:Deepfake魔高一尺,TextIn道高一丈

      只因开了一个视频会议,直接被骗1.8个亿 今年2月,一家跨国公司的香港分公司财务人员被一场精心策划的Deepfake视频会议诈骗,导致公司损失2亿港币(约1.8亿人民币). 事件起因是财务人员收到 ...

  4. Unreal Engine4 GPU崩溃或3D设备丢失的解决方案

    起因: Unreal Engine4 在渲染时报错GPU崩溃或3D设备丢失 解决办法: regedit  打开注册表 在以下2个路径下 新建 DWORD(32-bit) Value 命名为  TdrD ...

  5. @Primary ,@Qualifier ,@Autowired ,@Resource作用与区别

    首先阐述 @Autowired 和 @Resource 的区别 @Resource 是JDK自带的注解 可以按名称注入也可以按类型注入,默认是按名称注入,没有显式指定名称时,在spring容器中匹配与 ...

  6. 【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系

    阿里大数据产品体系是基于阿里云飞天平台上的数据处理服务.主要分为阿里云大数据基础产品和阿里云数加平台,其产品架构图如下所示: 一.阿里云大数据基础产品 1.云数据库--RDS(ApsaraDB for ...

  7. ROS基础入门——实操教程

    ROS基础入门--实操教程 前言 本教程实操为主,少说书.可供参考的文档中详细的记录了ROS的实操和理论,只是过于详细繁杂了,看得脑壳疼,于是做了这个笔记. Ruby Rose,放在这里相当合理 前言 ...

  8. Java日期时间API系列23-----Jdk8中java.time包中的新的日期时间API类,获取准确开始时间00:00:00,获取准确结束时间23:59:59等

    有时候,往往需要统计某个时间区间的销量等问题,这就需要准确的起始时间,获取准确开始时间00:00:00,获取准确结束时间23:59:59.下面增加了一一些方法,获取当天起始时间,昨天起始时间,当前月第 ...

  9. kotlin协程——>异常处理

    异常处理 本节内容涵盖了异常处理与在异常上取消.我们已经知道取消协程会在挂起点抛出 CancellationException 并且它会被协程的机制所忽略.在这⾥我们会看看在取消过程中抛出异常或同 ⼀ ...

  10. nginx配置tomcat的负载均衡记录

    实现效果 (1)浏览器地址栏输入地址 http://192.168.17.129/edu/a.html,负载均衡效果,平均在 8080和 8081 端口中. 准备工作 (1)准备两台 tomcat 服 ...