在微服务架构和云原生应用广泛采用的今天,.NET Core 应用被越来越多地部署在 Kubernetes 集群中。然而,一旦这些应用出现性能瓶颈,仅靠传统的日志和指标可能无法定位问题的根本原因。

从 .NET Core 3 开始,微软推出了一系列跨平台的运行时诊断工具,比如:

  • dotnet-counters:用于查看实时性能计数器

  • dotnet-dump:抓取和分析内存转储

  • dotnet-trace:采集运行时事件和 CPU 栈信息

  • dotnet-gcdump:采集垃圾回收(GC)相关信息

这些工具通过 .NET Core 的 Diagnostic Server 与目标进程进行通信,在 Linux 系统中,它们通过 Unix Domain Socket 进行 IPC 交互。默认的 Socket 文件位于 /tmp 目录下。

使用 Sidecar 模式部署诊断工具

在容器环境下部署诊断工具通常有两种方式:

  1. 将工具和应用程序打包在同一个镜像中

  2. 使用 sidecar 容器独立运行诊断工具

第一种方式会导致镜像体积变大,且工具升级不方便。因此,推荐使用 Sidecar 容器:它与主容器在同一个 Pod 中运行,共享网络和存储卷,适合部署监控或日志收集等辅助任务。

我们将构建一个 Sidecar 模式的诊断方案,解决以下三个关键问题:

  • 如何从 Sidecar 容器访问主容器内的 .NET Core 进程

  • 如何共享 /tmp 目录以建立 IPC 通道

  • 如何持久化诊断数据

案例演示:分析一个 ASP.NET Core Worker Service

首先,我们创建一个简单的 Worker Service 应用,它会周期性计算某个位置的质数(模拟 CPU 密集型任务):

_logger.LogInformation("Prime number at position {position} is {value}", pos, FindPrimeNumber(pos));

然后为该应用构建镜像并推送到容器仓库(如 Docker Hub 或 Azure 容器注册表)。

接着,我们构建第二个容器镜像,专用于运行诊断工具,包含:

dotnet tool install --tool-path /tools dotnet-trace
dotnet tool install --tool-path /tools dotnet-dump
dotnet tool install --tool-path /tools dotnet-counters

Kubernetes 部署设计

为了持久化诊断数据,我们需要一个挂载的共享存储。在 Azure Kubernetes Service (AKS) 中,我们可以动态创建基于 Azure Files 的存储卷。以下是关键的 YAML 片段:

apiVersion: apps/v1
kind: Deployment
spec:
template:
spec:
shareProcessNamespace: true
containers:
- name: toolbox
image: <your-sidecar-image>
volumeMounts:
- name: tmp
mountPath: /tmp
- name: data
mountPath: /data
- name: app
image: <your-app-image>
volumeMounts:
- name: tmp
mountPath: /tmp
volumes:
- name: tmp
emptyDir: {}
- name: data
persistentVolumeClaim:
claimName: monitor-azfiles

注意点

  • shareProcessNamespace: true 使得 Sidecar 可以看到主容器的进程

  • /tmp 目录通过 emptyDir 共享,建立 IPC 通道

  • Sidecar 容器的 /data 目录挂载 Azure Files 持久卷,用于存储诊断结果

  • 设置 stdin: truetty: true 保证 Sidecar 容器处于可交互状态

部署完成后,你可以使用 kubectl exec 命令进入 Sidecar 容器:

kubectl exec -it <pod-name> -n net-worker -c toolbox -- /bin/bash

实际运行诊断工具

1. 使用 dotnet-trace 采集追踪数据

首先获取主容器的进程 ID:

dotnet-trace ps

然后开始采集数据并将其保存到挂载的共享目录中:

dotnet-trace collect -p 13 --format Chromium -o /data/trace.json

下载 /data/trace.json 后,可以用 Chrome 或 Edge 浏览器访问 chrome://tracingedge://tracing 查看可视化结果。

2. 使用 dotnet-counters 查看性能指标
dotnet-counters collect --process-id 13 --refresh-interval 10 --output /data/counters --format json

同样可以将 JSON 文件下载后用 VS Code 打开分析。

总结

通过将诊断工具打包进 Sidecar 容器,并结合共享的 /tmp 目录和持久卷存储,我们可以在 Kubernetes 中高效、灵活地为 .NET Core 应用进行性能诊断。这种方式解耦了诊断工具与主应用容器,具有良好的可维护性和扩展性。

用 Sidecar 容器为 .NET Core 应用做诊断和性能分析的更多相关文章

  1. 将 Sidecar 容器带入新的阶段

    作者 | 徐迪.张晓宇 导读:本文根据徐迪和张晓宇在 KubeCon NA 2019 大会分享整理.分享将会从以下几个方面进行切入:首先会简单介绍一下什么是 Sidecar 容器:其次,会分享几个阿里 ...

  2. 重磅!K8S 1.18版本将内置支持SideCar容器。

    作者:justmine 头条号:大数据与云原生 微信公众号:大数据与云原生 创作不易,在满足创作共用版权协议的基础上可以转载,但请以超链接形式注明出处. 为了方便阅读,微信公众号已按分类排版,后续的文 ...

  3. 我们都可以把它放 Sidecar 容器中,这样微服务具备了 Super power,一种超能力

    云原生时代,微服务如何演进? 原创 李响 阿里技术 2020-08-28   https://mp.weixin.qq.com/s/KQG2U8_aotDL4YFB8ee6Zw 一  微服务架构与云原 ...

  4. 利用docker容器运行.net core webapi

    利用docker容器运行.net core webapi :first-child { margin-top: 0 !important; } > :last-child { margin-bo ...

  5. ASP.NET Core之跨平台的实时性能监控(2.健康检查)

    前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内容. 没看过上篇的,请移步:ASP.NET Core之跨平台的实时性 ...

  6. 健康检查NET Core之跨平台的实时性能监控

    ASP.NET Core之跨平台的实时性能监控(2.健康检查)   前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内 ...

  7. 使用Django.core.cache操作Memcached导致性能不稳定的分析过程

    使用Django.core.cache操作Memcached导致性能不稳定的分析过程 最近测试一项目,用到了Nginx缓存服务,那可真是快啊!2Gb带宽都轻易耗尽. 不过Api接口无法简单使用Ngin ...

  8. 用Chrome开发者工具做JavaScript性能分析

    来源: http://blog.jobbole.com/31178/ 你的网站正常运转.现在我们来让它运转的更快.网站的性能由页面载入速度和代码执行效率决定.一些服务可以让你的网站载入更快,比如压缩J ...

  9. chrome使用Timeline做性能分析

    使用Timeline做性能分析 Timeline面板记录和分析了web应用运行时的所有活动情况,这是研究和查找性能问题的最佳途径.###Timeline面板概览 Timeline面板主要有三个部分构成 ...

  10. 怎样让oracle实验本在不做实验时性能提升——win7下举例

    怎样让oracle实验本在不做实验时性能提升--win7下举例 型号:ThinkPad E431 系统:WIN7 实验使用的笔记本不使用数据库时.建议将oracle关闭,使其释放占用的资源. orac ...

随机推荐

  1. CTF-CRYPTO-ECC(2)

    CTF-CRYPTO-ECC(2) 椭圆加密 4.BSGS(小步大步法) [HITCTF 2021 ] task.py #Elliptic Curve: y^2 = x^3 + 7 mod N whi ...

  2. git 命令手册【不定时更新】

    本地分支 --> 远程服务器 git add xxx git commit -m "xxx" git push origin xxx 远程服务器 --> 本地分支 gi ...

  3. mysql8导入myslq5 报错

    打开sql文件替换 我的数据库编码是utf8mb4,如果你的数据库编码是别的,替换成你自己的编码. utf8mb4_0900_ai_ci替换为utf8mb4_general_ci

  4. mysql grant 用户权限

    用户添加授权 mysql> grant all privileges on *.* to 'niuben'@'%' identified by '123456' with grant optio ...

  5. ORACLE物理文件存储位置查询语句

    在进行备份和恢复的时候,我们需要知道一些关于ORACLE物理文件存储的信息,这样我们才能判断我们所进行的备份是否完整.一个完整的备份需要包括的物理文件:控制文件联机重做日志文件归档日志文件数据文件因此 ...

  6. BUUCTF---signin

    题目 welcome to crypto world!! 密文:424a447b57653163306d655f74345f424a444354467d 解题 啥也没有只有一段密文,只能从密文下手了, ...

  7. 【WinForm】使用选择文件的窗口样式选择文件夹

    使用选择文件的窗口样式选择文件夹 零.需求 传统的选择文件夹的方式太小了,不好操作,不过选择文件的方式倒是挺不错的,能不能把选择文件夹的方式改为选择文件这种样式呢? 选择文件夹 选择文件 壹.解决 1 ...

  8. 记一个.NET AOT交叉编译时的坑

    记一个.NET AOT交叉编译时的坑 背景: 使用.NET9开发的Avalonia项目需要部署到Linux-arm64 踩坑: 根据官方AOT交叉编译文档配置后执行打包 dotnet publish ...

  9. python环境配置命令

    在Python中,创建新的环境通常指的是创建一个隔离的Python环境,以便在该环境中安装和管理不同版本的库,而不会影响到系统中其他Python环境的库.这通常用于解决不同项目之间的依赖冲突.下面是一 ...

  10. 🎀spring @conditional介绍及使用

    简介 @Conditional 是 Spring 框架中用于条件化注册 Bean的核心注解,它允许开发者根据特定条件决定是否将某个Bean注册到 Spring 容器中.这一机制在实现多环境配置.模块化 ...