同步协程的必备工具: WaitGroup
1. 简介
本文将介绍 Go 语言中的 WaitGroup 并发原语,包括 WaitGroup 的基本使用方法、实现原理、使用注意事项以及常见的使用方式。能够更好地理解和应用 WaitGroup 来协调多个 Goroutine 的执行,提高 Go 并发编程的效率和稳定性。
2. 基本使用
2.1 定义
WaitGroup
是Go语言标准库中的一个结构体,它提供了一种简单的机制,用于同步多个协程的执行。适用于需要并发执行多个任务并等待它们全部完成后才能继续执行后续操作的场景。
2.2 使用方式
首先主协程创建WaitGroup实例,然后在每个协程的开始处,调用Add(1)
方法,表示需要等待一个任务执行完成,然后协程在任务执行完成之后,调用Done
方法,表示任务已经执行完成了。
主协程中,需要调用Wait()
方法,等待所有协程完成任务,示例如下:
func main(){
//首先主协程创建WaitGroup实例
var wg sync.WaitGroup
// 开始时调用Add方法表示有个任务开始执行
wg.Add(1)
go func() {
// 开始执行...
//完成之后,调用Done方法
wg.Done()
}()
// 调用Wait()方法,等待所有协程完成任务
wg.Wait()
// 执行后续逻辑
}
2.3 使用例子
package main
import (
"fmt"
"sync"
)
func main() {
var wg sync.WaitGroup
for i := 0; i < 5; i++ {
wg.Add(1)
go func(i int) {
defer wg.Done()
fmt.Printf("任务%d开始执行\n", i)
// 模拟协程任务执行一段时间
time.Sleep(time.Duration(rand.Int() % 100))
// 线程任务执行完成
fmt.Printf("任务%d执行完毕\n", i)
}(i)
}
fmt.Println("主协程开始等待所有任务执行完成...")
wg.Wait()
fmt.Println("所有协程已经执行完毕...")
}
在这个例子中,我们使用了sync.WaitGroup
来等待5个协程执行完毕。在循环中,每创建一个任务,我们调用一次wg.Add(1)
方法,然后启动一个协程去执行任务,当协程完成任务后,调用wg.Done
方法,告知主协程任务已经执行完毕。然后主协程会在5个协程任务全部执行完毕之后,才会继续向下执行。
3.实现原理
3.1 设计初衷
WaitGroup
的设计初衷就是为了等待一组操作完成后再执行下一步操作,通常会在一组协程中使用。
3.2 实现
sync.WaitGroup
结构体中的 state1
和 state2
字段是用于实现 WaitGroup
功能的重要变量。
type WaitGroup struct {
noCopy noCopy
state1 uint64
state2 uint32
}
由于 WaitGroup
需要等待一组操作完成之后再执行,因此需要等待所有操作完成之后才能继续执行。为了实现这个功能,WaitGroup 使用了一个计数器 counter
来记录还有多少个操作没有完成,如果 counter
的值为 0,则表示所有操作已经完成。
同时,WaitGroup
在所有任务都完成之后,需要唤醒所有处于等待的协程,此时需要知道有多少个协程处于等待状态。为了实现这个功能,WaitGroup 使用了一个等待计数器 waiter
来记录当前有多少个协程正在等待操作完成。
这里WaitGroup
对于计数器和等待计数器的实现,是通过一个64位无符号整数来实现的,也就是WaitGroup
结构体中的state1,其中高32位保存了任务计数器counter
的值,低32位保存了等待计数器waiter
的值。当我们创建一个 WaitGroup
实例时,该实例的任务计数器和等待计数器都被初始化为 0。
而且,等待协程需要等待所有任务完成之后才能继续执行,所以等待协程在任务未完成时会被阻塞,当任务全部完成后,自动被唤醒。WaitGroup
使用 state2
用于实现信号量机制。通过调用 runtime_Semacquire()
和 runtime_Semrelease()
函数,可以在不阻塞线程的情况下进行等待和通知操作。下面是Add
,Done
和Wait
方法的具体实现:
调用 Add()
方法增加/减小counter
的值,delta的值可以是正数,也可以是负数,下面是Add
方法的源码实现:
func (wg *WaitGroup) Add(delta int) {
// delta 的值可以为负数,Done方法便是通过Add(-1)来实现的
// statep: 为state1的地址 semap: 为state2的地址
statep, semap := wg.state()
// 高32位的值 加上 delta,增加任务计数器的值
state := atomic.AddUint64(statep, uint64(delta)<<32)
// v: 取高32位数据,获取到待完成任务数
v := int32(state >> 32)
// 取低32位数据,获取到等待线程的值
w := uint32(state)
// v > 0: 说明还有待完成的任务数,此时不应该唤醒等待协程
// w = 0: 说明没有协程在等待,此时可以直接退出
if v > 0 || w == 0 {
return
}
// 此时v = 0,所有任务都完成了,唤醒等待协程
*statep = 0
for ; w != 0; w-- {
runtime_Semrelease(semap, false, 0)
}
}
调用 Done()
方法表示完成了一个任务,通过调用Add
方法,delta
值为-1,减少任务计数器counter
的值,当其归为0时,便自动唤醒所有处于等待的协程。
// Done decrements the WaitGroup counter by one.
func (wg *WaitGroup) Done() {
wg.Add(-1)
}
调用Wait
方法,等待任务执行完成,增加等待计数器Waiter
的值:
func (wg *WaitGroup) Wait() {
// statep: 为state1的地址 semap: 为state2的地址
statep, semap := wg.state()
for {
// 加载state1的值
state := atomic.LoadUint64(statep)
// v: 取高32位数据,获取到待完成任务数
v := int32(state >> 32)
// 没有任务待执行,全部都完成了
if v == 0 {
return
}
// 增加waiter计数器的值
if atomic.CompareAndSwapUint64(statep, state, state+1) {
// 等待被唤醒
runtime_Semacquire(semap)
return
}
}
}
3.3 实现补充
Add
方法,Done
方法以及Wait
方法实现中,有一些异常场景的验证逻辑被我删除掉了。当出现异常场景时,说明用户使用方式和WaitGroup
的设计初衷相违背了,此时WaitGroup
就会直接panic。
下面通过说明使用的注意事项,来间接介绍WaitGroup
的异常验证逻辑。
4.使用注意事项
4.1 Add方法和Done方法需要成对出现
下面是一个Add方法和Done方法没有成对出现的例子,此时Add方法调多了,此时计数器永远大于0,Wait 方法会一直阻塞等待。
package main
import (
"fmt"
"sync"
)
func main() {
var wg sync.WaitGroup
wg.Add(2)
go func() {
defer wg.Done()
fmt.Println("Goroutine 1")
}()
go func() {
fmt.Println("Goroutine 2")
}()
wg.Wait()
fmt.Println("All goroutines finished")
}
在上述代码中,我们调用了wg.Add(2)
,但只调用了一次wg.Done()
。这会导致counter
的值大于0,因此调用wg.Wait()
会被永久阻塞,不会继续向下继续执行。
还有另外一种情况时Done方法调用多了,此时任务计数器counter
的值为负数,从WaitGroup
设计的语意来看,就是需要等待完成的任务数为负数,这个不符合预期,此时将会直接panic
package main
import (
"fmt"
"sync"
)
func main() {
var wg sync.WaitGroup
wg.Add(1)
go func() {
fmt.Println("Goroutine 1 started")
wg.Done() // 第一次调用Done方法
wg.Done() // 第二次调用Done方法
fmt.Println("Goroutine 1 completed")
}()
wg.Wait()
fmt.Println("All goroutines completed")
}
在上面的例子中,我们启动了一个goroutine,第一次调用Add
方法,counter的值变为1,在第14行调用Done
,此时计数器的值变为0,此时等待中的goroutine将会被唤醒。在第15行又调用了一次Done
方法,当counter减小为0时,再次调用Done
方法会导致panic,因为此时waitGroup
的计数器已经为0,再次减少将导致负数计数,这是不被允许的。
所以在调用Done方法时,需要保证每次调用都与Add方法的调用一一对应,否则会导致程序出现错误。
4.2 在所有任务都已经添加之后,才调用Wait方法进行等待
WaitGroup
的设计初衷就是为了等待一组操作完成后再执行下一步操作。所以,如果在所有任务添加之前,便调用Wait
方法进行等待,此时有可能会导致等待协程提前被唤醒,执行下一步操作,而尚未添加的任务则不会被等待,这违反了WaitGroup的设计初衷,也不符合预期。下面是一个简单的例子:
package main
import (
"fmt"
"sync"
"time"
)
func main() {
var wg sync.WaitGroup
for i := 1; i <= 3; i++ {
go func(id int) {
wg.Add(1)
defer wg.Done()
fmt.Printf("Goroutine %d started\n", id)
time.Sleep(time.Duration(id) * time.Second)
fmt.Printf("Goroutine %d finished\n", id)
}(i)
}
// 不等待所有任务添加,就开始等待
wg.Wait()
fmt.Println("All goroutines finished")
time.Sleep(10 * time.Second)
}
代码执行结果如下,等待协程被提前唤醒,执行之后的操作,而子任务在等待协程唤醒后才开始执行:
All goroutines finished
Goroutine 1 started
Goroutine 3 started
Goroutine 2 started
Goroutine 1 finished
Goroutine 2 finished
Goroutine 3 finished
在这个例子中,我们创建了三个协程并打印出它们开始和结束的消息。但是,我们没有在任务开始前调用Add
方法添加任务,而是在任务开始之后再调用Add
方法添加任务。
这可能会导致某些任务未被加入到WaitGroup
中,等待协程就调用了wg.Wait
方法,这样就会导致一些任务未被加入WaitGrou
,从而导致等待协程不会等待这些任务执行完成。如果这种情况发生了,我们会看到"All goroutines finished"被输出,但实际上有一些协程还没有完成。
因此,我们应该在所有任务添加完毕之后再调用Wait
方法,以保证等待的正确性。
5. WaitGroup常见使用方式
在函数或方法中使用,如果一个大任务可以拆分为多个独立的子任务,此时会将其进行拆分,并使用多个协程来并发执行这些任务,提高执行效率,同时使用WaitGroup
等待所有子任务执行完成,完成协程间的同步。
使用方式也比较简单,先创建一个 sync.WaitGroup
,在函数/方法中启动多个协程,每个协程执行一个任务。然后在协程开始执行任务前,调用 WaitGroup.Add(1)
,表示有一个任务要执行,然后在任务执行完成后调用 WaitGroup.Done()
,表示这个任务执行完成了。
最后,在函数/方法返回之前,需要调用 WaitGroup.Wait()
,等待所有的任务执行完成。大概示例如下:
func funcName() {
var wg sync.WaitGroup
for _, 任务 := range 任务列表 {
wg.Add(1)
go func() {
defer wg.Done()
//执行任务
}
}
// 调用wait方法等待所有任务完成
wg.Wait()
}
下面来看go-redis中ClusterClient
结构体中ForEachMaster
方法中对于WaitGroup
的使用。ForEachMaster
方法通常用于在 Redis 集群中执行针对所有主节点的某种操作,例如在集群中添加或删除键,或者执行一些全局的诊断操作,具体执行的操作由传入参数fn
指定。
这里ForEachMaster
方法会对所有主节点执行某种操作,这里的实现是对所有主节点执行某种操作这个大任务,拆分为多个独立的子任务,每个子任务完成对一个Master节点执行指定操作,然后每个子任务启动一个协程去执行,主协程使用WaitGroup
等待所有协程完成指定子任务,ForEachMaster
也就完成了对所有主节点执行某种操作的任务。具体实现如下:
func (c *ClusterClient) ForEachMaster(
ctx context.Context,
fn func(ctx context.Context, client *Client) error,
) error {
// 重新加载集群状态,以确保状态信息是最新的
state, err := c.state.ReloadOrGet(ctx)
if err != nil {
return err
}
var wg sync.WaitGroup
// 用于协程间通信
errCh := make(chan error, 1)
// 获取到redis集群中所有的master节点
for _, master := range state.Masters {
// 启动一个协程来执行该任务
wg.Add(1)
go func(node *clusterNode) {
// 任务完成时,调用Done告知WaitGroup任务已完成
defer wg.Done()
err := fn(ctx, node.Client)
if err != nil {
select {
case errCh <- err:
default:
}
}
}(master)
}
// 主协程等待所有任务完成
wg.Wait()
return nil
}
6.总结
本文介绍了 Go 语言中的 WaitGroup 并发原语,它提供了一种简单且强大的机制来协调多个 Goroutine 的执行。我们首先学习了 WaitGroup 的基本使用方法,包括如何创建 WaitGroup、如何向计数器中添加值、如何等待所有 Goroutine 完成以及如何在 Goroutine 中通知 WaitGroup 完成。
接着,我们了解了 WaitGroup 的实现原理,包括计数器和等待计数器的实现。了解了实现原理之后,我们可以更好地理解 WaitGroup 的内部机制以及如何更好地使用它来实现我们的需求。
在接下来的部分中,我们介绍了一些使用 WaitGroup 的注意事项,以及常见的使用方式。基于此,我们完成了对WaitGroup的介绍。
同步协程的必备工具: WaitGroup的更多相关文章
- golang协程同步的几种方法
目录 golang协程同步的几种方法 协程概念简要理解 为什么要做同步 协程的几种同步方法 Mutex channel WaitGroup golang协程同步的几种方法 本文简要介绍下go中协程的几 ...
- GO语言的进阶之路-协程和Channel
GO语言的进阶之路-协程和Channel 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 看过我之前几篇博客小伙伴可能对Golang语言的语法上了解的差不多了,但是,如果想要你的代码 ...
- 『GoLang』协程与通道
作为一门 21 世纪的语言,Go 原生支持应用之间的通信(网络,客户端和服务端,分布式计算)和程序的并发.程序可以在不同的处理器和计算机上同时执行不同的代码段.Go 语言为构建并发程序的基本代码块是 ...
- GoLang之协程
GoLang之协程 目前,WebServer几种主流的并发模型: 多线程,每个线程一次处理一个请求,在当前请求处理完成之前不会接收其它请求:但在高并发环境下,多线程的开销比较大: 基于回调的异步IO, ...
- Golang 之协程详解
转自:https://www.cnblogs.com/liang1101/p/7285955.html 一.Golang 线程和协程的区别 备注:需要区分进程.线程(内核级线程).协程(用户级线程)三 ...
- go协程
一.并发&并行 一个应用程序 ---> 一个进程 ---> 运行在自己内存地址空间里的独立执行体 ---> 同一个内存地址空间的一起工作的多个线程 一个并发程序 ---&g ...
- 发布一个基于协程和事件循环的c++网络库
目录 介绍 使用 性能 实现 日志库 协程 协程调度 定时器 Hook RPC实现 项目地址:https://github.com/gatsbyd/melon 介绍 开发服务端程序的一个基本任务是处理 ...
- go协程理解
一.Golang 线程和协程的区别 备注:需要区分进程.线程(内核级线程).协程(用户级线程)三个概念. 进程.线程 和 协程 之间概念的区别 对于 进程.线程,都是有内核进行调度,有 CPU 时间片 ...
- Go使用协程批量获取数据,加快接口返回速度
服务端经常需要返回一个列表,里面包含很多用户数据,常规做法当然是遍历然后读缓存. 使用Go语言后,可以并发获取,极大提升效率. 使用channel package main import ( &quo ...
- Python 中的进程、线程、协程、同步、异步、回调
进程和线程究竟是什么东西?传统网络服务模型是如何工作的?协程和线程的关系和区别有哪些?IO过程在什么时间发生? 一.上下文切换技术 简述 在进一步之前,让我们先回顾一下各种上下文切换技术. 不过首先说 ...
随机推荐
- ethcat开发记录 二
SOEM移植到stm32f407+LAN8720硬件上的注意点 1.LAN8720的PHY地址问题. 2.LAN8720芯片在上电后要对复位引脚操作. 3.使能LAN8720的混杂模式,在新的HAL库 ...
- @Scheduled不执行
今天发现@Scheduled不执行,注释掉netty的初始化事件就能正常执行了 原因是@PostConstruct是在主线程执行,@PostConstruct不能堵塞,堵塞会导致整个应用挂起不可用
- 反序列化 sqlserver 中的 sysdiagrams,找到其中包含的表的信息
转载于:Script SQL Server 2005 diagrams to a file - CodeProject /** <summary> Based on ufn_Varbina ...
- android charles 抓不到https包,翻了2天资料总算是找到答案了
问题, android7.0以上有权限限制,导致很多机子无法用Charles 抓ssl的包. 以下是我自己的坑请大家参考 原因一: 用Charles 工具上的地址去安装 chls.pro/ssl 原因 ...
- Elasticsearch 查询小笔记
2.x 版本,组合多查询https://www.elastic.co/guide/cn/elasticsearch/guide/current/combining-queries-together.h ...
- 纯css实现卡券式半圆及阴影(整理)
<!-- html部分 --> <div class="a"> <!-- a这个大卡片里边分上下两个卡片,对应上边灰色和下边白色部分 --> & ...
- 2003031118-李伟-Python数据分析第三周作业-第一次作业
项目 NumPy数值计算基础 博客名称 2003031118-李伟-Python数据分析第三周作业-第一次作业 课程班级博客链接 https://edu.cnblogs.com/campus/pexy ...
- FCC 高级算法题 收银机找零钱
Exact Change 设计一个收银程序 checkCashRegister() ,其把购买价格(price)作为第一个参数 , 付款金额 (cash)作为第二个参数, 和收银机中零钱 (cid) ...
- 2.20 Q_Learning 和Sarsa 的区别
二者都是基于Qtable的算法,其中Qlearning属于off-policy,Sarsa属于on-policy. 算法伪代码: 二者主要区别是更新Qtable的方式不同:
- 运行python脚本报错:selenium.common.exceptions.SessionNotCreatedException: Message: session not created
运行python脚本报错:selenium.common.exceptions.SessionNotCreatedException: Message: session not created 原因: ...