运维工具之Netdata
【导语】:Netdata 是一个开源、免费、预配置、高灵敏度的分布式实时监控系统。
简介
Netdata的分布式实时监视代理以零配置的方式,从系统、硬件、容器和应用程序收集数千个指标,它可以运行在所有的物理或虚拟服务器、容器、云和IoT设备上,可以在大多数Linux发行版(Ubuntu,Debian,CentOS等),容器平台(Kubernetes集群,Docker)和许多其他操作系统(FreeBSD,macOS)上安装,不需要sudo权限。
Netdata由系统管理员,DevOps工程师和开发人员设计,旨在收集所有内容,可视化监控指标,解决复杂的性能问题。
Netdata究竟怎么样?来看看用过的人是怎么说的:
- 无限指标:Netdata收集所有可用指标-越多越好
- CPU利用率:极低的CPU占用率,优化到极致的性能
- 内存占用:高效的数据库引擎将每秒的指标存储在内存中,然后将历史指标保存到磁盘
- 磁盘I/O:运行时,Netdata仅写入历史指标,并读取error和access记录日志,减少磁盘I/O
- 零配置:Netdata可以自动检测所有内容,并且可以立即为每台服务器收集10,000个指标
- 零维护:启动运行之后就可以不用管,Netdata负责剩余的工作
- 快速交互式可视化:仪表板对每个指标的查询响应时间不到1毫秒,可在用户平移时间,放大异常等的同时同步图表
- 异常检测:强调图表之间的关系,以帮助用户检测异常的根本原因
- 可扩展:可以将其安装在所有服务器,容器,VM和IoT设备上。默认情况下,度量标准不是集中式的,因此没有限制
- 多操作模式:在所有可能的配置中,自主主机监视(默认设置),无头数据收集器,转发代理,存储和转发代理,中央多主机监视。每个节点使用不同的指标保留策略,并在运行状况监视或不运行状况监视的情况下运行
- 与多应用的组合兼容:可收集300+个系统、容器和应用程序端点指标(APM、容器Docker、数据库MySQL等),将监视程序警告发送到20+个通知平台(Amazon SNS、Email、Syslog等),采样指标支持导出到30+个时序数据库(InfluxDB、Kafka、TiKV等),以实现互操作性
项目地址是:
https://github.com/netdata/netdata
下载安装
- 源码安装:要在大多数Linux系统(物理、虚拟、容器、IoT)上从源代码安装Netdata,可运行单行安装脚本。该脚本下载并构建所有依赖关系,包括选择连接到Netdata Cloud所需的所有依赖关系,并启用每晚自动更新和匿名统计信息。
bash <(curl -Ss https://my-netdata.io/kickstart.sh)
访问http://localhost:19999或http://NODE:19999
- Docker
docker run -d --name=netdata \
-p 19999:19999 \
-v netdataconfig:/etc/netdata \
-v netdatalib:/var/lib/netdata \
-v netdatacache:/var/cache/netdata \
-v /etc/passwd:/host/etc/passwd:ro \
-v /etc/group:/host/etc/group:ro \
-v /proc:/host/proc:ro \
-v /sys:/host/sys:ro \
-v /etc/os-release:/host/etc/os-release:ro \
--restart unless-stopped \
--cap-add SYS_PTRACE \
--security-opt apparmor=unconfined \
netdata/netdata
- 其他系统安装请自行查看官方文档,包括Kubernetes,deb/rpm安装包等。
工作机制
Netdata是一个高效、高度模块化、低延迟的指标管理引擎。它的无锁设计使其非常适合度量标准上的并发操作。
Netdata功能和体系结构的高级概述
运维工具之Netdata的更多相关文章
- CheungSSH国产自动化运维工具开源Web界面
CheungSSH web2.0 发布文档 CheungSSH 简介 CheungSSH是一款国人自主研发的Linux运维自动化管理服务器软件,秉着为企业降低运营成本,解放管理员双手和自动化生产的理念 ...
- 自动化运维工具Ansible详细部署 (转载)
自动化运维工具Ansible详细部署 标签:ansible 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://sofar.blog. ...
- 【运维工具】Git代码发布系统
引言 代码发布系统是互联网公司必备的运维系统,作用主要用户发布业务代码 到 业务服务器 为什么需要代码发布系统 有的同学可能说,我们公司服务器就那么一台,做个发布系统太麻烦了? 不认同这说法 发布系统 ...
- Python自动化运维工具fabric的安装
使用shell命令进行复杂的运维时,代码往往变得复杂难懂,而使用python脚本语言来编写运维程序,就相当于开发普通的应用一样,所以维护和扩展都比较简单,更重要的是python运维工具fabric能自 ...
- distri.lua的web运维工具
我的新手游项目很快就要进入到寻找发行商的环节,最近几天相对较空闲,逐将工作重心转移到服务器组运维工具的制作上. 回想一年之前经历的那个不算成功的端游项目,因为运维工具设计得不合理,使用十分不方便,游戏 ...
- 自动化运维工具之 Ansible 介绍及安装使用
一.初识Ansible 介绍: Absible 使用 模块(Modules)来定义配置任务.模块可以用标准脚本语言(Python,Bash,Ruby,等等)编写,这是一个很好的做法,使每个模块幂等.A ...
- 【运维工具】logrotate 日志管理神器
服务器经常会产生各种各样的日志文件,我们需要定期清理 日志的分类 系统日志 应用日志 系统日志 例如系统的history 历史信息 crontab的运行日志 一般系统日志系统都帮我们运维好了,不 ...
- 自动化运维工具之ansible
自动化运维工具之ansible 一,ansible简介 ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet.cfengine.chef.func.fab ...
- 自动化运维工具Ansible详细部署 - 人生理想在于坚持不懈 - 51CTO技术博客
自动化运维工具Ansible详细部署 - 人生理想在于坚持不懈 - 51CTO技术博客 自动化运维工具Ansible详细部署
- 用自动化运维工具解放IT运维
何谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行.这应该是所有业务系统运维终极目标. 我们对运维的要求通常是: 1.事前预警 在故障出现之前,管理人 ...
随机推荐
- 合合信息参编“生成式人工智能个人信息保护技术要求系列标准”,助力AI行业可信发展
生成式人工智能作为新一轮的技术革命成果,在赋能千行百业,给经济社会发展带来新机遇的同时,也产生了个人信息泄露.数据安全风险等问题.在此背景下,中国信息通信研究院(简称"中国信通院" ...
- mongodb 中rs.stauts()命令参数解析
转载请注明出处: rs.status()命令用于获取MongoDB副本集的状态信息.它提供了关于副本集中各个节点的详细信息,包括节点的健康状况.角色.选举状态等. 以下是查看一个mongo集群状态返回 ...
- java_day3_Scanner,顺序结构,选择结构(if,switch),循环结构(for,while),
一.Scanner 键盘录入:程序运行过程中,用户可以根据自己的需求输入参与运算的值 实现键盘录入的步骤 1.导包 2.创建键盘录入对象 3.调用方法实现键盘录入 1)输入整数 2)输入字符串 pub ...
- cortex-m3 m4 异常机制
文章写的很好,待整理 1.[STM32]HardFault问题详细分析及调试笔记 https://blog.csdn.net/m0_54916619/article/details/129979222 ...
- 信创环境经典版SuperMap iManager监控外部SuperMap iServer资源失败,无法监控目标GIS服务器CPU与内存使用情况
一.问题环境 操作系统:银河麒麟kylin V10 CPU:鲲鹏920 SuperMap iServer 10.2.0 SuperMap iManager 10.2.1 二.现象 部署完经典版Supe ...
- Windows应急响应-灰鸽子远控木马
目录 应急背景 木马查杀 1.查看异常连接 2.根据端口号查看对应进程文件 3.排查异常服务 4.发现启动项 开始查杀 入侵排查 1.账号排查 2.查看服务 3.查看启动项 4.查看计划任务 5.网络 ...
- MQ核心作用异步&削峰&解耦使用场景详解
说在前面 在如今的高并发互联网应用中,如何确保系统在巨大的流量冲击下还能稳稳当当运转,是每个技术团队都会遇到的挑战.说到这,消息队列(MQ) 就是背后的"大功臣"了. 无论是异步处 ...
- 深入理解Redis锁与Backoff重试机制在Go中的实现
目录 Redis锁的深入实现 Backoff重试策略的深入探讨 结合Redis锁与Backoff策略的高级应用 具体实现 结论 在构建分布式系统时,确保数据的一致性和操作的原子性是至关重要的.Redi ...
- 1.flask 源码解析:简介
目录 一.flask 源码解析:简介 1.1 flask 简介 1.2 两个依赖 1.2.1 werkzeug 1.2.2 Jinja2 1.3 如何读代码 Flask 源码分析完整教程目录:http ...
- CNI 基准测试:Cilium 网络性能分析
原文链接:https://cilium.io/blog/2021/05/11/cni-benchmark 作者:Thomas Graf 译者:罗煜.张亮,均来自KubeSphere 团队 Thomas ...