搭建基于Grafana+Prometheus+Node_exporter的性能监控与分析平台（Linux版）

在现代IT环境中，系统监控与分析是确保应用稳定性和高效性的关键。Prometheus与Grafana的结合，为我们提供了一个强大而灵活的监控解决方案，能够实时地收集、处理并展示系统性能指标。本文将详细介绍如何在Linux环境下搭建基于Grafana、Prometheus和Node_exporter的性能监控与分析平台。

一、平台组件概述

1.Node_exporter

Node_exporter是一个轻量级的数据采集器，专门用于Linux系统，收集CPU、内存、磁盘、网络等硬件和操作系统级别的性能指标。它通过HTTP服务以Prometheus可理解的格式提供这些数据，是Prometheus监控生态系统中的重要一环。

2.Prometheus

Prometheus是一个开源的监控和警报工具，负责从配置的目标（如Node_exporter）中抓取度量指标数据，并将其存储在自己的时间序列数据库中。在性能监控平台中，Prometheus作为数据收集、存储和查询的中心，与Grafana等可视化工具协同工作，提供全面的系统监控能力。

3.Grafana

Grafana是一个开源的监控和数据分析平台，支持多种数据源，并提供了丰富的图表和可视化选项。通过Grafana，我们可以轻松地将Prometheus中的性能测试数据以图表形式展示出来，实现实时监控和数据分析。

二、平台搭建步骤

1. 安装并启动Node_exporter

Node_exporter官网下载地址:https://prometheus.io/download/#node_exporter

选择Linux版本进行下载

# 进入创建的文件夹

cd /opt/performance

# 下载 node_exporter

wget https://github.com/prometheus/node_exporter/releases/download/v1.8.2/node_exporter-1.8.2.linux-amd64.tar.gz

# 解压

tar xvfz node_exporter-1.8.2.linux-amd64.tar.gz

# 进入到启动脚本位置

cd node_exporter-1.8.2.linux-amd64/

# node_exporter服务默认运行端口为9100

nohup ./node_exporter &

# 若9100端口被占用，使用以下命令指定端口运行服务

nohup ./node_exporter --web.listen-address=:9101 &

我们浏览器访问被监控服务器的9101端口，出现该页面，说明成功

如果浏览器无法访问该端口，可能是该端口的防火墙未开放

# 使用firewalld关闭防火墙

# 永久允许访问9100端口

sudo firewall-cmd --permanent --zone=public --add-port=9100/tcp

# 重新加载防火墙配置

sudo firewall-cmd --reload

2. 安装和配置Prometheus

Prometheus官网下载地址：https://prometheus.io/download/#/prometheus

# 进入创建的文件夹

cd /opt/performance

# 下载 Prometheus

wget https://github.com/prometheus/prometheus/releases/download/v3.0.0-beta.0/prometheus-3.0.0-beta.0.linux-amd64.tar.gz

# 解压

tar -zxvf prometheus-3.0.0-beta.0.linux-amd64.tar.gz

# 进入文件夹

cd prometheus-3.0.0-beta.0.linux-amd64/

# 启动prometheus

nohup ./prometheus --config.file=prometheus.yml &

我们浏览器访问9090端口，出现该页面，说明安装成功

将Node_exporter输出配置到Prometheus中

vim prometheus.yml

job_name: 任意字符串，可以理解为一个标识符
targets: node_exporter服务列表(ip + 端口号)，可以多个

重启Prometheus服务

# 查找 Prometheus 进程ID

ps aux | grep prometheus

# 强制停止Prometheus进程

kill -9 [PID]

# 重新启动Prometheus服务

nohup ./prometheus --config.file=prometheus.yml &

我们浏览器再次访问9090端口，并如下图点击目录，该页面中出现我们配置好的node_exporter，说明配置成功

3. 安装和配置Grafana

Grafana 官网下载地址：https://grafana.com/grafana/download

# 进入创建的文件夹

cd /opt/performance

# 下载 grafana

wget https://dl.grafana.com/enterprise/release/grafana-enterprise-11.1.3.linux-amd64.tar.gz

# 解压

tar -zxvf grafana-enterprise-11.1.3.linux-amd64.tar.gz

# 进入文件夹

cd grafana-v11.1.3

# 修改配置文件，如下图修改启用端口为8990

vim conf/defaults.ini

# 启动服务

./bin/grafana-server &

访问页面，成功显示。用户名 & 密码均为 admin

4. 创建仪表板和分析视图

I. 添加数据源

点击 Configuration -> Data sources 进入数据源界面，再点击 Add data source 进入新增数据源界面。

点击 Prometheus，创建Prometheus数据源。

根据下面的图片提示，填写表单：

点击 Save & test

II. 创建仪表盘

点击 Dashboards -> Browse 进入仪表盘界面，再点击 New - > import 进入导入仪表盘界面。

仪表盘模板大全：https://grafana.com/grafana/dashboards/

可根据关键字查询想要的一些模板

点击详情可获取id或获取json文件，若配置环境无网络情况下选择json文件。

我这里输入仪表盘ID：12633，点击导入仪表盘。

选择刚刚配置好的数据源，点击 Import 导入仪表盘。

点击 Import 后，展示如下页面。

后续可以在 Dashboards 页面中点击查看该仪表盘。

三、平台应用与优势

应用场景
- 实时监控：通过Grafana的仪表板，可以实时监控应用的性能指标，及时发现潜在的性能问题。
- 历史数据分析：利用Prometheus存储的历史数据，可以进行更深入的性能分析，找出性能瓶颈和趋势。
- 性能调优：基于监控和分析结果，对应用进行性能调优，提升用户体验。
优势
- 开源免费：Node_exporter、Prometheus和Grafana都是开源软件，可以免费使用，降低了成本。
- 灵活可扩展：平台支持自定义测试脚本和查询语句，可以根据实际需求进行灵活配置和扩展。
- 可视化效果好：Grafana提供了丰富的图表和可视化选项，能够直观地展示性能测试数据。

注：安装方法不唯一，且各个教程安装版本也不相同