【C语言/C++】你知道线程安全代码到底是怎么编写的吗?
相信有很多同学在面对多线程代码时都会望而生畏,认为多线程代码就像一头难以驯服的怪兽,你制服不了这头怪兽它就会反过来吞噬你。
夸张了哈,总之,多线程程序有时就像一潭淤泥,走不进去退不出来。
可这是为什么呢?为什么多线程代码如此难以正确编写呢?
从根源上思考
关于这个问题,本质上是有一个词语你没有透彻理解,这个词就是所谓的线程安全,thread safe。
如果你不能理解线程安全,那么给你再多的方案也是无用武之地。
接下来我们了解一下什么是线程安全,怎样才能做到线程安全。
这些问题解答后,多线程这头大怪兽自然就会变成温顺的小猫咪。
可上图关小猫咪屁事!
关你什么屁事
生活中我们口头上经常说的一句话就是“关你屁事”,大家想一想,为什么我们的屁事不关别人?
原因很简单,这是我的私事啊!我的衣服、我的电脑,我的手机、我的车子、我的别墅以及私人泳池(可以没有,但不妨碍想象),我想怎么处理就怎么处理,妨碍不到别人,只属于我一个人的东西以及事情当然不关别人,即使是屁事也不关别人。
我们在自己家里想吃什么吃什么,想去厕所就去厕所!因为这些都是我私有的,只有我自己使用。
那么什么时候会和其它人有交集呢?
答案就是公共场所。
在公共场所下你不能像在自己家里一样想去哪就去哪,想什么时候去厕所就去厕所,为什么呢?原因很简单,因为公共场所下的饭馆、卫生间不是你家的,这是公共资源,大家都可以使用的公共资源。
如果你想去饭馆、去公共卫生间那么就必须遵守规则,这个规则就是排队,只有前一个人用完公共资源后下一个人才可以使用,而且不能同时使用,想使用就必须排队等待。
上面这段话道理足够简单吧。
如果你能理解这段话,那么驯服多线程这头小怪兽就不在话下。
维护公共场所秩序
如果把你自己理解为线程的话,那么在你自己家里使用私有资源就是所谓的线程安全,原因很简单,因为你随便怎么折腾自己的东西(资源)都不会妨碍到别人;
但到公共场所浪的话就不一样了,在公共场所使用的是公共资源,这时你就不能像在自己家里一样想怎么用就怎么用想什么时候用就什么时候用,公共场所必须有相应规则,这里的规则通常是排队,只有这样公共场所的秩序才不会被破坏,线程以某种不妨碍到其它线程的秩序使用共享资源就能实现线程安全。
因此我们可以看到,这里有两种情况:
- 线程私有资源,没有线程安全问题
- 共享资源,线程间以某种秩序使用共享资源也能实现线程安全。
本文都是围绕着上述两个核心点来讲解的,现在我们就可以正式的聊聊编程中的线程安全了。
什么是线程安全
我们说一段代码是线程安全的,而且仅当我们在多个线程中同时且多次调用的这段代码都能给出正确的结果,这样的代码我们才说是线程安全代码,Thread Safety,否则就不是线程安全代码,thread-unsafe.。
非线程安全的代码其运行结果是由掷骰子决定的。
怎么样,线程安全的定义很简单吧,也就是说你的代码不管是在单个线程还是多个线程中被执行都应该能给出正确的运行结果,这样的代码是不会出现多线程问题的,就像下面这段代码:
int func() {
int a = 1;
int b = 1;
return a + b;
}
对于这样段代码,无论你用多少线程同时调用、怎么调用、什么时候调用都会返回2,这段代码就是线程安全的。
那么我们该怎样写出线程安全的代码呢?
要回答这个问题,我们需要知道我们的代码什么时候呆在自己家里使用私有资源,什么时候去公共场所浪使用公共资源,也就是说你需要识别线程的私有资源和共享资源都有哪些,这是解决线程安全问题的核心所在。
线程私有资源
线程都有哪些私有资源呢?啊哈,我们在上一篇《线程到底共享了哪些进程资源》中详细讲解了这个问题。
线程运行的本质其实就是函数的执行,函数的执行总会有一个源头,这个源头就是所谓的入口函数,CPU从入口函数开始执行从而形成一个执行流,只不过我们人为的给执行流起一个名字,这个名字就叫线程。
既然线程运行的本质就是函数的执行,那么函数运行时信息都保存在哪里呢?
答案就是栈区,每个线程都有一个私有的栈区,因此在栈上分配的局部变量就是线程私有的,无论我们怎样使用这些局部变量都不管其它线程屁事。
线程私有的栈区就是线程自己家。
线程间共享数据
除了上一节提到的剩下的区域就是公共场合了,这包括:
- 用于动态分配内存的堆区,我们用C/C++中的malloc或者new就是在堆区上申请的内存
- 全局区,这里存放的就是全局变量
- 文件,我们知道线程是共享进程打开的文件
有的同学可能说,等等,在上一篇文章不是说还有代码区和动态链接库吗?
要知道这两个区域是不能被修改的,也就是说这两个区域是只读的,因此多个线程使用是没有问题的。
在刚才我们提到的堆区、数据区以及文件,这些就是所有的线程都可以共享的资源,也就是公共场所,线程在这些公共场所就不能随便浪了。
线程使用这些共享资源必须要遵守秩序,这个秩序的核心就是对共享资源的使用不能妨碍到其它线程,无论你使用各种锁也好、信号量也罢,其目的都是在维护公共场所的秩序。
知道了哪些是线程私有的,哪些是线程间共享的,接下来就简单了。
值得注意的是,关于线程安全的一切问题全部围绕着线程私有数据与线程共享数据来处理,抓住了线程私有资源和共享资源这个主要矛盾也就抓住了解决线程安全问题的核心。
接下来我们看下在各种情况下该怎样实现线程安全,依然以C/C++代码为例,但是这里讲解的方法适用于任何语言,请放心,这些代码足够简单。
只使用线程私有资源
我们来看这段代码:
int func() {
int a = 1;
int b = 1;
return a + b;
}
这段代码在前面提到过,无论你在多少个线程中怎么调用什么时候调用,func函数都会确定的返回2,该函数不依赖任何全局变量,不依赖任何函数参数,且使用的局部变量都是线程私有资源,这样的代码也被称为无状态函数,stateless,很显然这样的代码是线程安全的。
这样的代码请放心大胆地在多线程中使用,不会有任何问题。
有的同学可能会说,那如果我们还是使用线程私有资源,但是传入函数参数呢?
线程私有资源+函数参数
这样的代码是线程安全的吗?自己先想一想这个问题。
答案是it depends,也就是要看情况。看什么情况呢?
1,按值传参
如果你传入的参数的方式是按值传入,那么没有问题,代码依然是线程安全的:
int func(int num) {
num++;
return num;
}
这这段代码无论在多少个线程中调用怎么调用什么时候调用都会正确返回参数加1后的值。
原因很简单,按值传入的这些参数是线程私有资源。
2,按引用传参
但如果是按引用传入参数,那么情况就不一样了:
int func(int* num) {
++(*num);
return *num;
}
如果调用该函数的线程传入的参数是线程私有资源,那么该函数依然是线程安全的,能正确的返回参数加1后的值。
但如果传入的参数是全局变量,就像这样:
int global_num = 1;
int func(int* num) {
++(*num);
return *num;
}
// 线程1
void thread1() {
func(&global_num);
}
// 线程2
void thread1() {
func(&global_num);
}
那此时func函数将不再是线程安全代码,因为传入的参数指向了全局变量,这个全局变量是所有线程可共享资源,这种情况下如果不改变全局变量的使用方式,那么对该全局变量的加1操作必须施加某种秩序,比如加锁。
有的同学可能会说如果我传入的不是全局变量的指针(引用)是不是就不会有问题了?
答案依然是it depends,要看情况。
即便我们传入的参数是在堆上(heap)用malloc或new出来的,依然可能会有问题,为什么?
答案很简单,因为堆上的资源也是所有线程可共享的。
假如有两个线程调用func函数时传入的指针(引用)指向了同一个堆上的变量,那么该变量就变成了这两个线程的共享资源,在这种情况下func函数依然不是线程安全的。
改进也很简单,那就是每个线程调用func函数传入一个独属于该线程的资源地址,这样各个线程就不会妨碍到对方了,因此,写出线程安全代码的一大原则就是能用线程私有的资源就用私有资源,线程之间尽最大可能不去使用共享资源。
如果线程不得已要使用全局资源呢?
使用全局资源
使用全局资源就一定不是线程安全代码吗?
答案还是。。有的同学可能已经猜到了,答案依然是要看情况。
如果使用的全局资源只在程序运行时初始化一次,此后所有代码对其使用都是只读的,那么没有问题,就像这样:
int global_num = 100; //初始化一次,此后没有其它代码修改其值
int func() {
return global_num;
}
我们看到,即使func函数使用了全局变量,但该全局变量只在运行前初始化一次,此后的代码都不会对其进行修改,那么func函数依然是线程安全的。
但,如果我们简单修改一下func:
int global_num = 100;
int func() {
++global_num;
return global_num;
}
这时,func函数就不再是线程安全的了,对全局变量的修改必须加锁保护。
线程局部存储
接下来我们再对上述func函数简单修改:
__thread int global_num = 100;
int func() {
++global_num;
return global_num;
}
我们看到全局变量global_num前加了关键词__thread修饰,这时,func代码就是又是线程安全的了。
为什么呢?
其实在上一篇文章中我们讲过,被__thread关键词修饰过的变量放在了线程私有存储中,Thread Local Storage,什么意思呢?
意思是说这个变量是线程私有的全局变量:
- global_num是全局变量
- global_num是线程私有的
各个线程对global_num的修改不会影响到其它线程,因为是线程私有资源,因此func函数是线程安全的。
说完了局部变量、全局变量、函数参数,那么接下来就到函数返回值了。
函数返回值
这里也有两种情况,一种是函数返回的是值;另一种返回对变量的引用。
1,返回的是值
我们来看这样一段代码:
int func() {
int a = 100;
return a;
}
毫无疑问,这段代码是线程安全的,无论我们怎样调用该函数都会返回确定的值100。
2,返回的是引用
我们把上述代码简单的改一改:
int* func() {
static int a = 100;
return &a;
}
如果我们在多线程中调用这样的函数,那么接下来等着你的可能就是难以调试的bug以及漫漫的加班长夜。。
很显然,这不是线程安全代码,产生bug的原因也很简单,你在使用该变量前其值可能已经被其它线程修改了。因为该函数使用了一个静态全局变量,只要能拿到该变量的地址那么所有线程都可以修改该变量的值,因为这是线程间的共享资源,不到万不得已不要写出上述代码,除非老板拿刀架在你脖子上。
但是,请注意,有一个特例,这种使用方法可以用来实现设计模式中的单例模式,就像这样:
class S {
public:
static S& getInstance() {
static S instance;
return instance;
}
private:
S() {}
// 其它省略
}
为什么呢?
因为无论我们调用多少次func函数,static局部变量都只会被初始化一次,这种特性可以很方便地让我们实现单例模式。
最后让我们来看下这种情况,那就是如果我们调用一个非线程安全的函数,那么我们的函数是线程安全的吗?
调用非线程安全代码
假如一个函数A调用另一个函数B,但B不是线程安全,那么函数A是线程安全的吗?
答案依然是,要看情况。
我们看下这样一段代码,这段代码在之前讲解过:
int global_num = 0;
int func() {
++global_num;
return global_num;
}
我们认为func函数是非线程安全的,因为func函数使用了全局变量并对其进行了修改,但如果我们这样调用func函数:
int funcA() {
mutex l;
l.lock();
func();
l.unlock();
}
虽然func函数是非线程安全的,但是我们在调用该函数前加了一把锁进行保护,那么这时funcA函数就是线程安全的了,其本质就是我们用一把锁间接的保护了全局变量。
再看这样一段代码:
int func(int *num) {
++(*num);
return *num;
}
一般我们认为func函数是非线程安全的,因为我们不知道传入的指针是不是指向了一个全局变量,但如果调用func函数的代码是这样的:
void funcA() {
int a = 100;
func(&a);
}
那么这时funcA函数依然是线程安全的,因为传入的参数是线程私有的局部变量,无论多少线程调用funcA都不会干扰到其它线程。
看了各种情况下的线程安全问题,最后让我们来总结一下实现线程安全代码都有哪些措施。
如何实现线程安全
从上面各种情况的分析来看,实现线程安全无外乎围绕线程私有资源和线程共享资源这两点,你需要识别出哪些是线程私有,哪些是共享的,这是核心,然后对症下药就可以了
- 不使用任何全局资源,只使用线程私有资源,这种通常被称为无状态代码
- 线程局部存储,如果要使用全局资源,是否可以声明为线程局部存储,因为这种变量虽然是全局的,但每个线程都有一个属于自己的副本,对其修改不会影响到其它线程
- 只读,如果必须使用全局资源,那么全局资源是否可以是只读的,多线程使用只读的全局资源不会有线程安全问题。
- 原子操作,原子操作是说其在执行过程中是不可能被其它线程打断的,像C++中的std::atomic修饰过的变量,对这类变量的操作无需传统的加锁保护,因为C++会确保在变量的修改过程中不会被打断。我们常说的各种无锁数据结构通常是在这类原子操作的基础上构建的 。
- 同步互斥,到这里也就确定了你必须要以某种形式使用全局资源,那么在这种情况下公共场所的秩序必须得到维护,那么怎么维护呢?通过同步或者互斥的方式,这是一大类问题,我们将在《深入理解操作系统》系列文章中详细阐述这一问题。
总结
怎么样,想写出线程安全的还是不简单的吧,如果本文你只能记住一句话的话,那么我希望是这句,这也是本文的核心:
实现线程安全无外乎围绕线程私有资源和线程共享资源来进行,你需要识别出哪些是线程私有,哪些是共享的,然后对症下药就可以了。
希望本文对大家编写多线程程序有帮助。
【C语言/C++】你知道线程安全代码到底是怎么编写的吗?的更多相关文章
- win32线程池代码(WinApi/C++)
win32线程池代码(WinApi/C++) 健壮, 高效,易用,易于扩, 可用于任何C++编译器 //说明, 这段代码我用了很久, 我删除了自动调整规模的代码(因为他还不成熟)/********** ...
- 写一个程序,统计自己C语言共写了多少行代码。ver2.00
概要 完成一个程序,作用是统计一个文件夹下面所有文件的代码行数.输入是一个文件夹的绝对路径,输出是代码行数.所以此程序的新特点有两个: 统计某一文件夹下的所有文件: 可以任意指定本机硬盘上任何位置的某 ...
- Jstack定位CPU使用最多的线程及代码
jstack可以定位到线程堆栈,根据堆栈信息我们可以定位到具体代码,所以它在JVM性能调优中使用得非常多.下面我们来一个实例找出某个Java进程中最耗费CPU的Java线程并定位堆栈信息,用到的命令有 ...
- C 语言实例 - 输出当前文件执行代码
C 语言实例 - 输出当前文件执行代码 输出当前文件执行代码,__FILE__ 为当前执行的文件常量. 实例 #include <stdio.h> int main() { FILE *f ...
- 通过调用C语言的库函数与在C代码中使用内联汇编两种方式来使用同一个系统调用来分析系统调用的工作机制
通过调用C语言的库函数与在C代码中使用内联汇编两种方式来使用同一个系统调用来分析系统调用的工作机制 前言说明 本篇为网易云课堂Linux内核分析课程的第四周作业,我将通过调用C语言的库函数与在C代码中 ...
- C语言实现推箱子游戏完整代码
C语言实现推箱子游戏完整代码 前言 自己做的,可能有些代码不够工整,或者有些小问题,但游戏的基本操作是可以实现的 代码效果 代码一共分为8个部分,4个控制上下左右移动,2个判断输赢,1个统计归为的个数 ...
- PHP代码重用与函数编写
代码重用与函数编写 1.使用require()和include()函数 这两个函数的作用是将一个文件爱你载入到PHP脚本中,这样就可以直接调用这个文件中的方法.require()和include()几 ...
- [转] Socket心跳包异常检测的C语言实现,服务器与客户端代码案例
转载自:zxh2075的专栏 在Socket心跳机制中,心跳包可以由服务器发送给客户端,也可以由客户端发送给服务器,不过比较起来,前者开销可能较大.本文实现的是由客户端给服务器发送心跳包,服务器不必返 ...
- 11月21日内容总结——多进程实现TCP服务端并发、互斥锁、线程及代码实现、GIL全局解释器锁、信号量、event事件、进程池和线程池、协程
目录 一.多进程实现TCP服务端并发 二.互斥锁代码实操 1.互斥锁的概念 2.互斥锁的使用 3.死锁现象 4. 小结 三.线程理论 进程 线程 线程简介 为什么要使用多线程? 多线程概念 多进程的优 ...
- C++11的简单线程池代码阅读
这是一个简单的C++11实现的线程池,代码很简单. 原理就是管理一个任务队列和一个工作线程队列. 工作线程不断的从任务队列取任务,然后执行.如果没有任务就等待新任务的到来.添加新任务的时候先添加到任务 ...
随机推荐
- webpack 科学修改 node_modules 某个包的部分文件为本地文件
需求总是千变万化,npm 不是万能的,node_modules 里面的文件也是需要维护的. 如果 npm install 安装了某个包,然而这个包里面部分文件不支持你的需求,这时候怎么办? 比如:ht ...
- Bash Shell 30min 过家家
带你捅破窗户纸 - 备注 : @博客园 : 1. 为什么不支持 pdf 上传了呀 2. 网站分类不好用 3. 排版OA工具升级下, 例如 markdown 写出来好丑. 尝试升级下呢 ? 后记: 学如 ...
- Trae 开发工具与使用技巧
大家好,我是 V 哥. 前不久,字节重磅推出 AI 原生 IDE Trae,有了这款工具,程序员的开发效率得到了大大的提升,如何你是程序员,还没有使用起来,那 V 哥建议你即刻起马上安装上,谁用谁知道 ...
- AI 代理的未来是事件驱动的
AI 代理即将彻底改变企业运营,它们具备自主解决问题的能力.适应性工作流以及可扩展性.但真正的挑战并不是构建更好的模型. 代理需要访问数据.工具,并且能够在不同系统之间共享信息,其输出还需要能被多个服 ...
- MySQL常用SQL 语句
--备份数据库 mysqldump -u用户名 -h主机名 -p密码 数据库名 > filename.sql --备份数据库中的某个表 mysqldump -u用户名 -h主机名 -p密码 数据 ...
- Linux系统挂载未分配硬盘空间
先查看未挂载之前的磁盘使用情况 发现磁盘使用率已经达到了96%,迫切需要扩容 查看分区情况fdisk –l 首先确保有可分配的磁盘空间 发现/dev/vda下有400多个G 的空间 所以将/dev/v ...
- ShadowSql之借Dapper打通ORM最后一公里
ShadowSql专职拼写sql,要想做为ORM就需要借高人之手 我们要借的就是Dapper,Dapper以高性能著称,ShadowSql搭配Dapper就是强强联手 为此本项目内置了一个子项目Dap ...
- javaWeb基础之会话(Cookies、Session)
一. 1. 会话:一次会话中包含多次请求和响应 2. 一次会话:浏览器第一次给服务器资源发送请求,会话建立,直到有一方断开为止[浏览器关闭或服务器关闭] 功能:在一次会话的范围内的多次请求间,共享数据 ...
- 🎀windows-剪切板
简介 Windows 剪贴板是一个临时存储区域,它允许用户在不同应用程序之间复制和粘贴文本.图像和其他类型的数据.从 Windows 10 开始,微软引入了一个改进的剪贴板功能,称为剪贴板历史记录,它 ...
- Windows执行bat脚本乱码
解决方案: 将脚本编码设置为ANSI