前情回顾

前文我们完成了如下功能
1 根据配置文件启动多个协程监控日志,并启动协程监听配置文件。
2 根据配置文件热更新,动态协调日志监控。
3 编写测试代码,向文件中不断写入日志并备份日志,验证系统健壮性。

本节目标

我们旨在编写一个健壮性较强的日志监控系统,不得不考虑这样一个问题,当某个日志监控协程崩溃或者异常退出,该如何处理?
我的想法是当监控日志文件的协程异常退出时,在主协程复活这个异常退出的协程,使其继续工作,这样极大的增强了系统的稳定性。

借尸还魂,增加异常处理

我们在tailf.go的WatchLogFile中增加异常处理,在协程崩溃时打印日志信息,并且向keychan中写入字符串通知主协程处理。

func WatchLogFile(pathkey string, datapath string, ctx context.Context, keychan chan<- string) {
//省略之前写好的逻辑
//....
defer func() {
if errcover := recover(); errcover != nil {
fmt.Println("goroutine watch ", pathkey, " panic")
fmt.Println(errcover)
keychan <- pathkey
}
}()
//省略逻辑....
}

WatchLogFile函数进行了扩充,增加了pathkey字符串表示监控哪个日志文件,pathkey实际是config.yaml中的路径的key值。
keychan 实际是一个缓冲chan,用来和主协程通信,告诉自己挂掉了。
WatchLogFile 中其余逻辑和前文一样,不做赘述。

主协程中增加复活逻辑

同样,在主协程中我们需要创建keychan这个缓冲chan,并且捕获子协程发过来的崩溃消息。

func main(){
//....省略
keyChan := make(chan string, KEYCHANSIZE)
//....
for {
select {
case pathData, ok := <-pathChan:
//省略...
case keystr := <-keyChan:
val, ok := configMgr[keystr]
if !ok {
continue
}
fmt.Println("recover goroutine watch ", keystr)
var ctxcover context.Context
ctxcover, val.ConfigCancel = context.WithCancel(context.Background())
go logtailf.WatchLogFile(keystr, val.ConfigValue,
ctxcover, keyChan)
}
}
}

在主协程中愿有逻辑基础上,我们增加了keyChan的初始化,以及keychan数据的监听。
当主协程收到keychan的数据时,我们可以根据keystr修改其对应的context,并且启动新的协程继续监听该日志文件。
这样就达到了复活那些异常死掉的协程的目的。

keychan该如何回收

keychan被多个子协程引用,该如何回收?这种情况下多个子协程写数据,一个主协程接受数据,我们常用的策略如下:
1 不要在接受协程中关闭chan,因为如果此时有其他发送协程向关闭的chan写数据会导致崩溃。
2 有多个发送协程,等待最后一个发送协程退出时关闭chan可防止崩溃。
3 不作处理,等待系统回收,前提是保证所有协程正常退出,否则会导致资源泄漏。
我再三考虑了一下,统计最后协程退出会增加逻辑的复杂性,所以交给系统回收吧,但是我做好了协程的死锁检测和退出通知,应该不会有问题。

制造协程崩溃现场,模拟测试系统稳定性

为了测试我们的系统稳定性,我在修改WatchLogFile函数,新增如下处理,中断key值为logdir3的监控协程,进而观察主协程能否再次启动协程监听该日志文件。

func WatchLogFile(pathkey string, datapath string, ctx context.Context, keychan chan<- string) {
//...省略
defer func() {
if errcover := recover(); errcover != nil {
fmt.Println("goroutine watch ", pathkey, " panic")
fmt.Println(errcover)
keychan <- pathkey
}
}() //模拟崩溃
if pathkey == "logdir3" {
panic("test panic ")
}
//...省略

然后我们启动日志系统,看到如下效果

从日志上可以看到每当我们的协程挂掉,主协程会启动新的协程继续监听日志,保证了系统的稳定性。
谢谢关注我的公众号

源码下载地址
https://github.com/secondtonone1/golang-/tree/master/logcatchsys

Go项目实战:打造高并发日志采集系统(五)的更多相关文章

  1. Go项目实战:打造高并发日志采集系统(一)

    项目结构 本系列文章意在记录如何搭建一个高可用的日志采集系统,实际项目中会有多个日志文件分布在服务器各个文件夹,这些日志记录了不同的功能.随着业务的增多,日志文件也再增多,企业中常常需要实现一个独立的 ...

  2. Go项目实战:打造高并发日志采集系统(六)

    前情回顾 前文我们完成了日志采集系统的日志文件监控,配置文件热更新,协程异常检测和保活机制. 本节目标 本节加入kafka消息队列,kafka前文也介绍过了,可以对消息进行排队,解耦合和流量控制的作用 ...

  3. Go项目实战:打造高并发日志采集系统(二)

    日志统计系统的整体思路就是监控各个文件夹下的日志,实时获取日志写入内容并写入kafka队列,写入kafka队列可以在高并发时排队,而且达到了逻辑解耦合的目的.然后从kafka队列中读出数据,根据实际需 ...

  4. Go项目实战:打造高并发日志采集系统(三)

    前文中已经完成了文件的监控,kafka信息读写,今天主要完成配置文件的读写以及热更新.并且规划一下系统的整体结构,然后将之前的功能串起来形成一套完整的日志采集系统. 前情提要 上一节我们完成了如下目标 ...

  5. Go项目实战:打造高并发日志采集系统(四)

    前情回顾 前文我们完成了如下目标1 项目架构整体编写2 使框架支持热更新 本节目标 在前文的框架基础上,我们1 将之前实现的日志监控功能整合到框架中.2 一个日志对应一个监控协程,当配置热更新后根据新 ...

  6. 《实战java高并发程序设计》源码整理及读书笔记

    日常啰嗦 不要被标题吓到,虽然书籍是<实战java高并发程序设计>,但是这篇文章不会讲高并发.线程安全.锁啊这些比较恼人的知识点,甚至都不会谈相关的技术,只是写一写本人的一点读书感受,顺便 ...

  7. 《实战Java高并发程序设计》读书笔记

    文章目录 第二章 Java并行程序基础 2.1 线程的基本操作 2.1.1 线程中断 2.1.2 等待(wait)和通知(notify) 2.1.3 等待线程结束(join)和谦让(yield) 2. ...

  8. 【实战Java高并发程序设计 7】让线程之间互相帮助--SynchronousQueue的实现

    [实战Java高并发程序设计 1]Java中的指针:Unsafe类 [实战Java高并发程序设计 2]无锁的对象引用:AtomicReference [实战Java高并发程序设计 3]带有时间戳的对象 ...

  9. 【实战Java高并发程序设计6】挑战无锁算法:无锁的Vector实现

    [实战Java高并发程序设计 1]Java中的指针:Unsafe类 [实战Java高并发程序设计 2]无锁的对象引用:AtomicReference [实战Java高并发程序设计 3]带有时间戳的对象 ...

随机推荐

  1. (转)VMware虚拟机三种网络模式的区别及配置方法;

    我的一点实际经验理解桥接和NAT 桥接是虚拟机完全作为一个独立的地址接在局域网中,NAT是虚拟机依赖宿主主机地址转换的一种方式 例子我的虚拟机如果用桥接模式,连接外部网站如百度时会提示此pc没有装公司 ...

  2. 用cmd 如何输入命令,进入文件夹

    用cmd 如何输入命令 进入文件夹 盘符: 例如想进入D盘 d: cd 进入到当前盘某个目录.cd \ 进入当前盘根目录cd \windows 进入到当前盘Windows目录cd.. 退出到上一级目录 ...

  3. Java中的数据结构通俗易懂的介绍

    Java中有几种常用的数据结构,主要分为Collection和map两个主要接口(接口只提供方法,并不提供实现),而程序中最终使用的数据结构是继承自这些接口的数据结构类. List(接口)List是有 ...

  4. Apache、nginx 、lighttpd性能比较

    Apache.nginx .lighttpd性能比较 1. web服务器简介 1. lighttpd Lighttpd是一个德国人领导的开源软件,其根本的目的是提供一个专门针对高性能网站,安全.快速. ...

  5. mongodb命令---花样查询语句

    闲言少叙 查出价格低于200的商品信息----包含商品名称,货物编号,价格,添加信息等 db.goods.find( {}}, {,,,} ) 商品分类不为3的商品 db.goods.find( {} ...

  6. 长春理工大学第十四届程序设计竞赛H Arithmetic Sequence——使用特例

    题目 链接 题意:给定一个数X,输出一个等差数列,使得和为X. 分析 由等差数列的定义,可见一个数就是等差数列,两个数也是等差数列 #include<bits/stdc++.h> usin ...

  7. 无法识别的配置节点 applicationSettings/* Properties.Settings 解决方法

    http://blog.csdn.net/yaoxtao/article/details/7766888 在项目中引用web service时,偶然出现 无法识别的配置节点 applicationSe ...

  8. vue-cli3构建多页面应用

    创建一个项目hello-world vue create hello-worldcd hello-worldnpm run serve 在src目录下新建pages目录,在pages下新建页面 App ...

  9. AGC029C - Lexicographic constraints

    记录我心路历程吧,这道小水题暴露出我很多问题. 给定 \(n\) 个字符串长度 \(a_i\) ,求字符集最小多大,才能构造出按字典序比较 \(s_1 < s_2 < \dots < ...

  10. elastic search&logstash&kibana 学习历程(四)kibana安装部署和使用

    kibana在linux上的部署安装 运行环境是centos7 基于jdk8 下载安装包:wget https://artifacts.elastic.co/downloads/kibana/kiba ...