前言:

 前一篇文中介绍了.NET Core-全局性能诊断工具 的使用方法,那么接下来自己实现一个简单.NET Core的诊断工具。

 该工具主要包括:.NET Core 程序进程信息查看、性能计数器结果获取、Dump抓取、Trace 文件生成等一些基本功能

 本文主要采用:Microsoft.Diagnostics.NETCore.Client 库来实现相关功能

一、Microsoft.Diagnostics.NETCore.Client 介绍:

 简介:

  Microsoft.Diagnostics.NETCore.Client(也称为Diagnostics客户端库)是一个托管库,可让您与.NET Core运行时(Core CLR)进行交互以执行各种与诊断相关的任务,

  例如:跟踪,请求转储或附加ICorProfiler 。使用此库,您可以编写针对特定情况定制的自己的诊断工具。

 安装方式:

Install-Package Microsoft.Diagnostics.NETCore.Client

二、工具实现:

 1、创建项目:DiagnosticsTools(.NET 5.0 Winform项目)

  添加包引用:

Install-Package Microsoft.Diagnostics.NETCore.Client
Install-Package Microsoft.Diagnostics.Tracing.TraceEvent 

  项目结构:

   

  调整窗体界面如下:

   

 2、获取当前所有.Net Core 3.0及以上的进程列表

/// <summary>
/// 获取进程状态:.Net Core 3.0及以上进程
/// </summary>
private void PrintProcessStatus()
{
   //定位上次记录
int row = dgvPros.CurrentCell == null ? 0 : dgvPros.CurrentCell.RowIndex;
int col = dgvPros.CurrentCell == null ? 0 : dgvPros.CurrentCell.ColumnIndex;
var data = DiagnosticsClient.GetPublishedProcesses()
.Select(Process.GetProcessById)
.Where(process => process != null)
.Select(o => { return new { o.Id, o.ProcessName, o.StartTime, o.Threads.Count }; }); dgvPros.DataSource = data.ToList();
if (dgvPros.Rows.Count > row)
dgvPros.CurrentCell = dgvPros.Rows[row].Cells[col];
}

 3、获取当前进程基本信息:

private string GetProInfo(Process info)
{
StringBuilder stringBuilder = new StringBuilder();
stringBuilder.Append("进程影象名:" + info.ProcessName + "\r\n");
stringBuilder.Append("进程ID:" + info.Id + "\r\n");
stringBuilder.Append("启动线程树:" + info.Threads.Count.ToString() + "\r\n");
stringBuilder.Append("CPU占用时间:" + info.TotalProcessorTime.ToString() + "\r\n");
stringBuilder.Append("线程优先级:" + info.PriorityClass.ToString() + "\r\n");
stringBuilder.Append("启动时间:" + info.StartTime.ToLongTimeString() + "\r\n");
stringBuilder.Append("专用内存:" + (info.PrivateMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("峰值虚拟内存:" + (info.PeakVirtualMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("峰值分页内存:" + (info.PeakPagedMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("分页系统内存:" + (info.PagedSystemMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("分页内存:" + (info.PagedMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("未分页系统内存:" + (info.NonpagedSystemMemorySize64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("物理内存:" + (info.WorkingSet64 / 1024).ToString() + "K" + "\r\n");
stringBuilder.Append("虚拟内存:" + (info.VirtualMemorySize64 / 1024).ToString() + "K");
return stringBuilder.ToString();
}

 4、监听进程相关事件(CLR、Dynamic、Kernel等):

/// <summary>
/// 进程运行事件输出:CLR、性能计数器、动态处理(cpu使用率超过90%则抓取dump)
/// </summary>
/// <param name="processId">进程id</param>
/// <param name="threshold">cpu使用率</param>
private void PrintRuntime(int processId, int threshold = 90)
{
if (!diagnosticsCache.ContainsKey(processId))
{
var providers = new List<EventPipeProvider>()
{
new EventPipeProvider("Microsoft-Windows-DotNETRuntime",EventLevel.Informational, (long)ClrTraceEventParser.Keywords.Default),
//性能计数器:间隔时间为1s
new EventPipeProvider("System.Runtime",EventLevel.Informational,(long)ClrTraceEventParser.Keywords.None,
new Dictionary<string, string>() {{ "EventCounterIntervalSec", "1" }})
}; DiagnosticsClient client = new DiagnosticsClient(processId);
diagnosticsCache[processId] = client;
using (EventPipeSession session = client.StartEventPipeSession(providers, false))
{
var source = new EventPipeEventSource(session.EventStream); source.Clr.All += (TraceEvent obj) =>
{
if (dgvPros.CurrentRow != null && obj.ProcessID.Equals(dgvPros.CurrentRow.Cells[0].Value))
{
string msg = $"Clr-{obj.EventName}-";
if (obj.PayloadNames.Length > 0)
{
foreach (var item in obj.PayloadNames)
msg += $"{item}:{ obj.PayloadStringByName(item)}-";
}
TextAppendLine(msg);
}
};
source.Dynamic.All += (TraceEvent obj) =>
{
if (dgvPros.CurrentRow != null && obj.ProcessID.Equals(dgvPros.CurrentRow.Cells[0].Value))
{
string msg = $"Dynamic-{obj.EventName}-{string.Join("|", obj.PayloadNames)}";
//性能计数器事件
if (obj.EventName.Equals("EventCounters"))
{
var payloadFields = (IDictionary<string, object>)(obj.PayloadByName(""));
if (payloadFields != null)
payloadFields = payloadFields["Payload"] as IDictionary<string, object>; if (payloadFields != null)
{
msg = $"Dynamic-{obj.EventName}-{payloadFields["DisplayName"]}:{payloadFields["Mean"]}{payloadFields["DisplayUnits"]}";
TextAppendLine(msg);
}
//如果CPU使用率超过90%抓取dump
if (payloadFields != null && payloadFields["Name"].ToString().Equals("cpu-usage"))
{
double cpuUsage = Double.Parse(payloadFields["Mean"].ToString());
if (cpuUsage > (double)threshold)
{
client.WriteDump(DumpType.Normal, "/tmp/minidump.dmp");
}
}
}
else
{
if (obj.PayloadNames.Length > 0)
{
foreach (var item in obj.PayloadNames)
msg += $"{item}:{ obj.PayloadStringByName(item)}-";
}
TextAppendLine(msg);
}
}
};
source.Kernel.All += (TraceEvent obj) =>
{
if (dgvPros.CurrentRow != null && obj.ProcessID.Equals(dgvPros.CurrentRow.Cells[0].Value))
{
string msg = $"Kernel-{obj.EventName}-{string.Join("|", obj.PayloadNames)}";
TextAppendLine(msg);
}
}; try
{
source.Process();
}
catch (Exception e)
{
string errorMsg = $"错误:{e}";
TextAppendLine(errorMsg);
}
}
}
}

 5、Dump抓取功能:

/// <summary>
/// 抓取Dmp文件
/// </summary>
/// <param name="processId"></param>
private void TriggerCoreDump(int processId)
{
saveFileDialog1.Filter = "Dump文件|*.dmp";
if (saveFileDialog1.ShowDialog() == DialogResult.OK)
{
var client = new DiagnosticsClient(processId);
//Normal = 1,WithHeap = 2,Triage = 3,Full = 4
client.WriteDump(DumpType.Normal, saveFileDialog1.FileName, false);
}
}

  参数说明:

转储类型。

  • Normal:仅包括捕获进程中所有现有线程的所有现有跟踪的堆栈跟踪所需的信息。有限的GC堆内存和信息。
  • WithHeap:包括GC堆和捕获进程中所有现有线程的堆栈跟踪所必需的信息。
  • Triage:仅包括捕获进程中所有现有线程的所有现有跟踪的堆栈跟踪所需的信息。有限的GC堆内存和信息。
  • Full:在此过程中包括所有可访问的内存。原始内存数据包含在末尾,因此可以直接映射初始结构,而无需原始内存信息。此选项可能会导致非常大的转储文件。

 6、生成进程指定事件内Trace文件

/// <summary>
/// 写入Trace文件
/// </summary>
/// <param name="processId">进程ID</param>
/// <param name="duration">指定时间范围(单位s)</param>
private void TraceProcessForDuration(int processId, int duration)
{
saveFileDialog1.Filter = "Nettrace文件|*.nettrace";
if (saveFileDialog1.ShowDialog() == DialogResult.OK)
{
var cpuProviders = new List<EventPipeProvider>()
{
new EventPipeProvider("Microsoft-Windows-DotNETRuntime", EventLevel.Informational, (long)ClrTraceEventParser.Keywords.Default),
new EventPipeProvider("Microsoft-DotNETCore-SampleProfiler", EventLevel.Informational, (long)ClrTraceEventParser.Keywords.None)
};
var client = new DiagnosticsClient(processId);
using (var traceSession = client.StartEventPipeSession(cpuProviders))
{
Task copyTask = Task.Run(async () =>
{
using (FileStream fs = new FileStream(saveFileDialog1.FileName, FileMode.Create, FileAccess.Write))
{
await traceSession.EventStream.CopyToAsync(fs);
}
}); copyTask.Wait(duration * 1000);
traceSession.Stop();
}
}
}

三、运行效果

 运行效果如下图:实现相关效果

  

总结:

 通过微软提供的 Microsoft.Diagnostics.NETCore.Client 比较简单的就实现了这些功能,当然注册的事件里面还有很多信息分析等着去解锁。

 这只是走出了简单的第一步,后续还任重而道远

其他:

 参考:https://github.com/dotnet/diagnostics

 源码:https://github.com/cwsheng/DiagnosticsTools

.NET Core 服务诊断工具的更多相关文章

  1. 动手实现一个适用于.NET Core 的诊断工具

    前言 大家可能对诊断工具并不陌生,从大名鼎鼎的 dotTrace,到 .NET CLI 推出的一系列的高效诊断组件(dotnet trace,dotnet sos,dotnet dump)等, 这些工 ...

  2. 轻量级.Net Core服务注册工具CodeDi发布啦

    为什么做这么一个工具 因为我们的系统往往时面向接口编程的,所以在开发Asp .net core项目的时候,一定会有大量大接口及其对应的实现要在ConfigureService注册到ServiceCol ...

  3. .Net Core服务诊断排查

    前言: 近期在项目中出现了几次服务内存资源占用较高的情况,特回顾梳理下排查过程以及对相应问题的排查方法总结. 一.Dump抓取 抓取dump的方式有多种,下面介绍几种常用的: 1. 任务管理器中找到程 ...

  4. .NET Core-全局性能诊断工具

    前言: 现在.NET Core 上线后,不可避免的会出现各种问题,如内存泄漏.CPU占用高.接口处理耗时较长等问题.这个时候就需要快速准确的定位问题,并解决. 这时候就可以使用.NET Core 为开 ...

  5. 中小研发团队架构实践之生产环境诊断工具WinDbg 三分钟学会.NET微服务之Polly 使用.Net Core+IView+Vue集成上传图片功能 Fiddler原理~知多少? ABP框架(asp.net core 2.X+Vue)模板项目学习之路(一) C#程序中设置全局代理(Global Proxy) WCF 4.0 使用说明 如何在IIS上发布,并能正常访问

    中小研发团队架构实践之生产环境诊断工具WinDbg 生产环境偶尔会出现一些异常问题,WinDbg或GDB是解决此类问题的利器.调试工具WinDbg如同医生的听诊器,是系统生病时做问题诊断的逆向分析工具 ...

  6. .NET Core CLI 的性能诊断工具介绍

    前言 开发人员的.NET Core项目上线后,经常会出现各种问题,内存泄漏,CPU 100%,处理时间长等, 这个时候就需要快速并准确的发现问题,并解决问题, 除了项目本身的日志记录外,NET Cor ...

  7. (转)权威支持: 选择正确的 WebSphere 诊断工具

    权威支持: 选择正确的 WebSphere 诊断工具 原文:https://www.ibm.com/developerworks/cn/websphere/techjournal/0807_supau ...

  8. 使用诊断工具观察 Microsoft.Extensions.DependencyInjection 2.x 版本的内存占用

    目录 准备工作 大量接口与实现类的生成 elasticsearch+kibana+apm asp.net core 应用 请求与快照 Kibana 上的请求记录 请求耗时的分析 请求内存的分析 第2次 ...

  9. Microsoft.Extensions.DependencyInjection 之二:使用诊断工具观察内存占用

    目录 准备工作 大量接口与实现类的生成 elasticsearch+kibana+apm asp.net core 应用 请求与快照 Kibana 上的请求记录 请求耗时的分析 请求内存的分析 第2次 ...

随机推荐

  1. python3 中is和==的区别

    is    身份运算符,用来判断对象是否属于同一地址 (python内置函数id() 可以返回对象地址) ==  比较运算符,用于判断值是否相同

  2. Centos7下安装JDK详细过程记录

    1.查询系统是否安装了java: [root@bogon ~]# java -version 根据上图显示,系统默认安装了Openjdk,它和我们使用的java jdk有些区别(具体的可度娘),所以需 ...

  3. 运维趋势2019年总结,运维就是要做到"技多不压身"

    2019年 在互联网这个行业中对运维的要求越来越来越高,比如2015.16年的时候,运维只是做一些人力投入的事情,比如重启个服务,搭建一个nginx,mysql主从服务,简单的优化一下,就可以上线了, ...

  4. Python面向对象练习题

    1.模拟栈操作原理 先进后出 ​1.初始化(创建一个存储数据的列表) 2.进栈使用列表保存数据 ​ 3.出栈 使用列表删除数据 ​ 4.查看栈顶元素 切片获取列表最后一位数据 ​5.判断是否为空栈 6 ...

  5. Distributed | Paxos

    自Paxos问世以来就持续垄断了分布式一致性算法,Paxos这个名词几乎等同于分布式一致性.Google的很多大型分布式系统都采用了Paxos算法来解决分布式一致性问题.在学习了Raft算法之后自然不 ...

  6. React 错误边界组件

    这是React16的内容,并不是最新的技术,但是用很少被讨论,直到通过文档发现其实也是很有用的一部分内容,还是总结一下- React中的未捕获的 JS 错误会导致整个应用的崩溃,和整个组件树的卸载.从 ...

  7. python基础(一):变量和常量

    变量 什么是变量 变量,用于在内存中存放程序数据的容器.计算机的核心功能就是"计算",CPU是负责计算的,而计算需要数据吧?数据就存放在内存里,例如:将梁同学的姓名,年龄存下来,让 ...

  8. Qt开发技术:图形视图框架(一)基本介绍

    前话   使用到Qt的视图框架.   Qt视图框架介绍 简介   图形视图框架(The Graphic View Framework)用于管理和与大量定制的二维图形项目交互,以及用于可视化项目的视图小 ...

  9. ubuntu16.04 下同时打开多个终端窗口

    reference :https://forums.solydxk.com/viewtopic.php?t=5139 reference : http://blog.51cto.com/huqilon ...

  10. 【笔记】《Redis设计与实现》chapter18 发布与订阅

    chapter18 发布与订阅 客户端订阅频道. 客户端向频道发送消息, 消息被传递至各个订阅者. 匹配模式 客户端订阅模式. 客户端向频道发送消息, 消息被传递给正在订阅匹配模式的订阅者. 另一个模 ...