在Rust语言中,一个既引人入胜又可能带来挑战的特性是闭包如何从其所在环境中捕获变量,尤其是在涉及多线程编程的情境下。

如果尝试在不使用move关键字的情况下创建新线程并传递数据至闭包内,编译器将很可能返回一系列与生命周期借用规则所有权相关的复杂错误信息。

不过,这种机制虽然增加了学习曲线,但也确保了内存安全与并发执行中的数据一致性。

本文我们将探讨如何在线程的闭包中安全的使用变量,包括共享变量和修改变量。

1. 向线程传递变量

首先,我们构造一个简单的示例,在线程中正常使用一个外部的变量,看看Rust中能否正常编译运行。

use std::thread;

fn main() {
let msg = String::from("Hello World!"); let handle = thread::spawn(|| {
// msg 是主线中定义的变量
println!("{}", msg);
}); handle.join().unwrap();
}

例子非常简单,看着写法也没什么问题,在其他编程语言中类似的写法是没有问题的。

但是,使用cargo run运行时,却有如下的错误:

为什么会有这样的错误?这就是Rust在内存方面更加严谨的原因。

上面Rust的错误信息中也给出了原因,总结起来主要有两点:

  1. 线程的生命周期:新创建的线程的生命周期有可能超出主函数 main 的执行范围。当 main 函数终止时,与之相关的局部变量(也就是msg)将超出作用域。
  2. 不符合借用规则:在 Rust 中,引用的生命周期不会超过其所指向数据的生命周期,以避免出现悬空引用。如果main提前结束,那么线程中的msg将成为悬空引用

修复的方法很简单,使用move关键字,将变量的所有权转移到线程中就可以了。

    let handle = thread::spawn(move || {
// msg 是主线中定义的变量
println!("{}", msg);
});

这样就可以正常运行了。

不过,这样,主线程中就无法使用变量msg了,比如在main函数的最后打印msg,会报错,因为它的所有权已经转移到线程中了。

2. 多线程共享变量引用

如果我们只把变量的引用转移给线程,是不是可以在主线程main中继续使用变量msg呢?

use std::thread;

fn main() {
let msg = String::from("Hello World!");
let msg_ref = &msg; let handle = { thread::spawn(move || {
// msg 是主线中定义的变量
println!("{}", msg_ref);
})
}; handle.join().unwrap(); println!("msg in main : {}", msg_ref);
}

很遗憾,依然有错误:

错误的原因仍然是传入线程中的变量引用msg_ref生命周期的不够长。

虽然我们使用了move,将msg_ref转移到线程中,但main中仍然拥有底层的数据msg

一旦main函数结束(或者数据在线程完成之前超出范围),该引用(msg_ref)指向数据将失去有效的内存,成为悬空引用

总的来说就是:

  1. 移动引用并不移动原始数据-只转移引用本身的所有权
  2. 实际数据(msg)仍然由原始范围拥有,并具有自己的生命周期约束

为了修复这个错误,就要用到Rust中提供的并发原语Arc(一种自动引用计数的智能指针)。

先看看使用Arc修改后的例子。

use std::sync::Arc;
use std::thread; fn main() {
let msg = String::from("Hello World!");
// 通过Arc来创建变量的引用
let msg_ref = Arc::new(msg); // 线程1
let handle_1 = {
// move 之前,先使用Arc clone 变量
let msg_thread = Arc::clone(&msg_ref); thread::spawn(move || {
println!("Thread 1: {}", msg_thread);
})
}; // 线程2
let handle_2 = {
let msg_thread = Arc::clone(&msg_ref); thread::spawn(move || {
println!("Thread 2: {}", msg_thread);
})
}; handle_1.join().unwrap();
handle_2.join().unwrap(); // 主线程中依然可以使用变量
println!("msg in main : {}", msg_ref);
}

使用Arc修改之后,变量不仅可以在多个线程中共享,主线程中也可以使用。

3. 多线程中修改变量

上面的示例是在多个线程中共享变量,如果想要修改变量的话,那么就会出现数据竞争的情况。

这时,就要用到Rust的另一个并发原语Mutex

use std::sync::{Arc, Mutex};
use std::thread; fn main() {
// 创建一个被Mutex保护的共享数据,这里是一个i32类型的数字
let shared_number = Arc::new(Mutex::new(0)); // 定义一个线程向量,用于存储创建的线程
let mut threads = Vec::new(); // 创建10个线程,每个线程对共享数据进行1000次递增操作
for _ in 0..10 {
// 克隆Arc,使得每个线程都拥有一个指向共享数据的引用
let num_clone = Arc::clone(&shared_number);
let handle = thread::spawn(move || {
// 尝试获取Mutex的锁,这是一个阻塞操作,如果锁不可用,线程会等待
let mut num = num_clone.lock().unwrap();
for _ in 0..1000 {
*num += 1;
}
});
threads.push(handle);
} // 等待所有线程完成操作
for handle in threads {
handle.join().unwrap();
} // 获取最终的共享数据值并打印
let final_num = shared_number.lock().unwrap();
println!("最终10个线程的累加结果: {}", final_num);
}

在这个示例中:

  1. 首先创建了一个Arc<Mutex<i32>>类型的共享数据,Arc用于在多个线程间共享MutexMutex用于保护内部的i32数据。
  2. 循环创建10个线程,每个线程都克隆了Arc并尝试获取Mutex的锁。一旦获取到锁,线程就可以安全地对共享数据进行递增操作。
  3. 主线程使用join方法等待所有子线程完成操作。
  4. 最后,主线程获取并打印共享数据的最终值。由于Mutex的保护,多个线程对共享数据的操作不会产生数据竞争,保证了数据的一致性。

运行结果:

10个线程,每个累加1000,所以最后结果是1000*10=10000

4. 总结

从上面的例子可以看出,Rust的闭包捕获规则最初可能感觉很严格,但它们在确保内存安全数据竞争自由方面至关重要。

总之,

如果需要在另一个线程中拥有数据,考虑使用move

如果需要跨线程共享数据,考虑使用Arc

如果需要跨线程共享和修改数据,考虑使用Arc+Mutex

Rust多线程中安全的使用变量的更多相关文章

  1. Rust多线程中的消息传递机制

    代码说话. use std::thread; use std::sync::mpsc; use std::time::Duration; fn main() { let (tx, rx) = mpsc ...

  2. Rust语言中的常量,变量,运算符,数据类型

    简单练练, 夏天太热. const MAX_POINTS: u32 = 100_100; fn main() { let mut x = 5; let y = 5; let y = y + 1; le ...

  3. 多线程(三)~多线程中数据的可见性-volatile关键字

    我们先来看一段代码: ①.线程类,用全局布尔值控制线程是否结束,每隔1s打印一次当前线程的信息 package com.multiThread.thread; publicclassPrintStri ...

  4. Java多线程中变量的可见性

    之所以写这篇博客, 是因为在csdn上看到一个帖子问的就是这个问题. 废话不多说, 我们先看看他的代码(为了减少代码量, 我将创建线程并启动的部分修改为使用方法引用). 1 2 3 4 5 6 7 8 ...

  5. C#中多线程中变量研究

    今天在知乎上看到一个问题[为什么在同一进程中创建不同线程,但线程各自的变量无法在线程间互相访问?].在多线程中,每个线程都是独立运行的,不同的线程有可能是同一段代码,但不会是同一作用域,所以不会共享. ...

  6. 最强肉坦:RUST多线程

    Rust最近非常火,作为coder要早学早享受.本篇作为该博客第一篇学习Rust语言的文章,将通过一个在其他语言都比较常见的例子作为线索,引出Rust的一些重要理念或者说特性.这些特性都是令人心驰神往 ...

  7. 多线程中的volatile和伪共享

      伪共享 false sharing,顾名思义,“伪共享”就是“其实不是共享”.那什么是“共享”?多CPU同时访问同一块内存区域就是“共享”,就会产生冲突,需要控制协议来协调访问.会引起“共享”的最 ...

  8. Spark中Lambda表达式的变量作用域

    通常,我们希望能够在lambda表达式的闭合方法或类中访问其他的变量,例如: package java8test; public class T1 { public static void main( ...

  9. c#初学-多线程中lock用法的经典实例

    本文转载自:http://www.cnblogs.com/promise-7/articles/2354077.html 一.Lock定义     lock 关键字可以用来确保代码块完成运行,而不会被 ...

  10. Java多线程中易混淆的概念

    概述 最近在看<ThinKing In Java>,看到多线程章节时觉得有一些概念比较容易混淆有必要总结一下,虽然都不是新的东西,不过还是蛮重要,很基本的,在开发或阅读源码中经常会遇到,在 ...

随机推荐

  1. gal game 杂谈——《GINKA》

    gal game 杂谈--<GINKA> 剧情梳理 Ps:女主分为小学阶段和高中阶段,这里称小学阶段为小时候的女主,高中阶段为大女主,分离出来爱的为GINKA(长相是小时候的女主). 1. ...

  2. ADMM——交替方向乘子法

    ADMM(Alternating Direction Method of Multipliers,交替方向乘子法)是一种优化算法,主要用于解决分布式.大规模和非光滑的凸优化问题.ADMM通过将原始问题 ...

  3. apisix启动报错undefined symbol: EVP_KDF_ctrl, version OPENSSL_1_1_1b

    报错内容 2024/08/06 16:56:13 [error] 154236#154236: *7039 [lua] plugin.lua:110: load_plugin(): failed to ...

  4. etcd错误:Failed to defragment etcd member[127.0.0.1:2379] (context deadline exceeded)

    etcd 版本 # etcdctl version etcdctl version: 3.5.1 API version: 3.5 问题 在 执行 etcdctl --endpoints=http:/ ...

  5. windows 上部署 kafka 做测试

    1.下载 需要下载 zookeeper 和kafka 我下载的版本是 2.部署 2.1 部署 zookeeper 2.1.1 新建配置文件 zoo.cfg 内容为 tickTime = 2000 da ...

  6. ZCMU-1153

    思路 一个感觉是规律问题的数学问题 因为输入的是n所以要的出有关n的关系或者关系 有关排序,所以可以从位次入手,设双胞胎前一个位置在ai,后一个在bi. Sum(bi-ai)=(2+3+4+5+6+. ...

  7. Element-UI 调整

    1.对话框 当打开的对话框页面元素众多,俨然一个iframe页面时,可以做2个优化: 滚动条:对话框去滚动,当对话框内容过多时,把滚动条控制在对话框内部,避免出现页面级的滚动条 标题栏:优化对话框标题 ...

  8. Tailwind CSS样式优先级控制

    前情 Tailwind CSS 是一个原子类 CSS 框架,它将基础的 CSS 全部拆分为原子级别,能达到最小化项目CSS.它的工作原理是扫描所有 HTML 文件.JavaScript 组件以及任何模 ...

  9. 树莓派4B 微雪7寸触摸屏 双屏 触摸屏校正

    树莓派4B+微雪7寸触摸屏+PC显示器,以触摸屏位主显示,PC显示器扩展,这时会有触摸不准的情况. 通过观察可以发现触摸被放大到了整个屏幕,即触摸屏+PC显示器. 1. 通过查看2个屏幕分辨率和位置, ...

  10. 【第2章】matlab程序设计基础

    matlab语言的常量与变量 matlab语言的变量命名规则 由一个字母引导,后面可以为其他字符. 区分大小写 如Abc ≠ ABc matlab的保留常量 以下为系统保留常量,自己定义的变量不能与他 ...