RocksDB事务的隔离性分析【原创】

Rocksdb事务隔离性指的是多线程并发事务使用时候，事务与事务之间的隔离性，通过加锁机制来实现，本文重点剖析Read Commited隔离级别下，Rocksdb的加锁机制。

Rocksdb事务相关类族

Rocksdb的事务相关的类图如下图所示。主要有两个类族，Transaction和DB，默认采用PessimisticTransaction，而PessimisticTransaction内部的加锁机制通过TransactionLockMgr来实现的。

TransactionLockMgr内部维护了LockMap。TransactionLockMgr根据每个记录的Key计算hash值，再对num_stripes取模，在LockMap中的向量Std::vector<LockMapStripe>定位LockMapStripe，这样减少实体锁的竞争激烈程度，相当于锁分解。

LockMap的数据成员如下

Size_t num_stripes LockMapStripe个数，默认16个

Std::vector<LockMapStripe> LockMapStripe数组

LockMapStripe的数据成员如下

std::shared_ptr<TransactionDBMutex> stripe_mutex : 实体锁

std::shared_ptr<TransactionDBCondVar> stripe_cv : 实体条件变量

std::unordered_map<std::string, LockInfo> keys : 具有相同Key hash值的每条记录的加锁信息，std::string为记录的Key值。

LockInfo的数据成员如下

bool exclusive : 排它锁，还是共享锁

uint64_t expiration_time : 锁的过期时间

autovector<TransactionID> txn_ids : 这把锁阻塞的事务ID列表

2. Rocksdb事务流程分析

上述流程，是应用创建TransactionDB，然后Put一条记录，再Commit的协作流程图，在Put阶段调用TransactionLockMgr的TryLock方法，Commit阶段调用TransactionLockMgr的UnLock方法。

TransactionLockMgr：：TryLock内部的主要逻辑在AcquireLocked函数中，TransactionLockMgr：：UnLock内部的主要逻辑在UnlockKey函数中，下面具体分析这两个函数。绿色部分字体为个人注解。

AcquireLocked

Status TransactionLockMgr::AcquireLocked(LockMap* lock_map,

LockMapStripe* stripe,

const std::string& key, //记录的Key值

Env* env,

LockInfo&& txn_lock_info, //当前事务锁信息

uint64_t* expire_time, //锁的过期时间

autovector<TransactionID>* txn_ids)

{

Status result;

auto stripe_iter = stripe->keys.find(key); // 检查这条记录的Key是否已经被加锁了。

if (stripe_iter != stripe->keys.end()) { // 这条记录的Key已经被之前事务加过锁

LockInfo& lock_info = stripe_iter->second;

if (lock_info.exclusive || txn_lock_info.exclusive) { //之前事务或者当前事务加的是排他锁，

if (lock_info.txn_ids.size() == 1 &&

lock_info.txn_ids[0] == txn_lock_info.txn_ids[0]) { //之前加锁的事务就是当前事务

lock_info.exclusive = txn_lock_info.exclusive;

lock_info.expiration_time = txn_lock_info.expiration_time;

} else { //之前加锁的事务不是当前事务

if (IsLockExpired(txn_lock_info.txn_ids[0], lock_info, env,

expire_time)) { // 之前事务加的锁已经过期，可以清除

lock_info.txn_ids = txn_lock_info.txn_ids;

lock_info.exclusive = txn_lock_info.exclusive;

lock_info.expiration_time = txn_lock_info.expiration_time;

} else {

result = Status::TimedOut(Status::SubCode::kLockTimeout);

*txn_ids = lock_info.txn_ids; // 返回之前事务列表

}

} else { //当前事务加的是共享锁

lock_info.txn_ids.push_back(txn_lock_info.txn_ids[0]);

lock_info.expiration_time =

std::max(lock_info.expiration_time, txn_lock_info.expiration_time);

}

} else { // 这条记录的Key没有被之前事务加过锁

if (max_num_locks_ > 0 &&

lock_map->lock_cnt.load(std::memory_order_acquire) >= max_num_locks_) {

result = Status::Busy(Status::SubCode::kLockLimit);

} else {

// 当前事务执行加锁操作

stripe->keys.emplace(key, std::move(txn_lock_info));

if (max_num_locks_) {

lock_map->lock_cnt++;

}

return result;

}

UnlockKey逻辑相对简单一些，主要是删除加锁的记录，并且唤醒被阻塞的事务。

void TransactionLockMgr::UnLockKey(const PessimisticTransaction* txn,

const std::string& key,

LockMapStripe* stripe, LockMap* lock_map,

Env* env) {

TransactionID txn_id = txn->GetID();

auto stripe_iter = stripe->keys.find(key);

if (stripe_iter != stripe->keys.end()) {

auto& txns = stripe_iter->second.txn_ids;

auto txn_it = std::find(txns.begin(), txns.end(), txn_id);

// Found the key we locked. unlock it.

if (txn_it != txns.end()) {

if (txns.size() == 1) {

stripe->keys.erase(stripe_iter);

} else {

auto last_it = txns.end() - 1;

if (txn_it != last_it) {

*txn_it = *last_it;

}

txns.pop_back();

}

if (max_num_locks_ > 0) {

// Maintain lock count if there is a limit on the number of locks.

assert(lock_map->lock_cnt.load(std::memory_order_relaxed) > 0);

lock_map->lock_cnt--;

}

} else {

// This key is either not locked or locked by someone else. This should

// only happen if the unlocking transaction has expired.

assert(txn->GetExpirationTime() > 0 &&

txn->GetExpirationTime() < env->NowMicros());

}

RocksDB事务的隔离性分析【原创】的更多相关文章

MySQL：事务的隔离性
[参考文章]:数据库的事务特性及隔离级别 1. 事务的四大特性 1.1 原子性(Atomicity) 原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚,因此事务的操作如果成功就必须要完全应用 ...
一文搞懂MySQL事务的隔离性如何实现｜MVCC
关注公众号[程序员白泽],带你走进一个不一样的程序员/学生党前言 MySQL有ACID四大特性,本文着重讲解MySQL不同事务之间的隔离性的概念,以及MySQL如何实现隔离性.下面先罗列一下MySQ ...
Mysql学习之事务的隔离性
今天咱们说说事务,相信大家都知道事务的 ACID (Atomicity.Consistency.Isolation.Durability,即原子性.一致性.隔离性.持久性). 原子性:表示一个事务不可 ...
Spring 事务机制详解（事务的隔离性和传播性）
原文出处: 陶邦仁 Spring事务机制主要包括声明式事务和编程式事务,此处侧重讲解声明式事务,编程式事务在实际开发中得不到广泛使用,仅供学习参考. Spring声明式事务让我们从复杂的事务处理中得到 ...
具体问题:Spring 事务的隔离性，并说说每个隔离性的区别
使用步骤: 步骤一.在spring配置文件中引入<tx:>命名空间<beans xmlns="http://www.springframework.org/schema/b ...
事务四大特征：原子性，一致性，隔离性和持久性(ACID)
一.事务定义:所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位. 准备工作:为了说明事务的ACID原理,我们使用银行账户及资金管理的案例进行分析. [sql] ...
跟面试官侃半小时MySQL事务隔离性，从基本概念深入到实现
提到MySQL的事务,我相信对MySQL有了解的同学都能聊上几句,无论是面试求职,还是日常开发,MySQL的事务都跟我们息息相关. 而事务的ACID(即原子性Atomicity.一致性Consiste ...
事务传播性、隔离性与MVCC
一.事务传播性 1.1 什么是事务的传播性事务的传播性一般在事务嵌套时候使用,比如在事务A里面调用了另外一个使用事务的方法,那么这俩个事务是各自作为独立的事务执行提交,还是内层的事务合并到外层的事务 ...
事务ACID特性，其中I代表隔离性(Isolation)。
事务ACID特性,其中I代表隔离性(Isolation). 什么是事务的隔离性? 隔离性是指,多个用户的并发事务访问同一个数据库时,一个用户的事务不应该被其他用户的事务干扰,多个并发事务之间要相互隔离 ...

随机推荐

vue项目中使用bpmn-番外篇(留言问题总结)
前情提要 “vue项目中使用bpmn-xxxx”系列的七篇文章在上周已经更新完成,发表后,有小伙伴在使用时提出了一些文章中没有讲到的问题,此篇作为番外篇,将大家提出的共性问题解答一下,欢迎大家支持原创 ...
PIC单片机的定时器
PIC单片机的定时器有3个 timer0 timer1 timer2 定时器的计算方法 256*k*Tcy=定时时间 (256-Init-value)*k*Tcy=定时时间
[Objective-C] 021 KVC、KVO
写过C#的都知道C#通过反射读写一个对象的属性特别方便,可以利用字符串的方式去动态控制一个对象.其实在ObjC中,我们可以更高级点,根本不必进行任何操作就可以进行属性的动态读写,这种方式就是Key V ...
[微信营销企划之路]003.Access forbidden!
引言继<[微信营销企划之路]001.环境搭建(XAMPP+WeiPHP)>后,有不少朋友反应按照001教程配置虚拟多站点(<VirtualHost/>)后,部分站点会出现Ac ...
深入浅出Spring MVC
摘要本文旨在详细分析SpringMVC工作原理以及作为开发者如何基于SpringMVC做扩展.因为SpringMVC分析的文章比较多,所以本文重点讲解如何利用SpringMVC的扩展点实现我们的需求 ...
AES实现财务数据的加密解密存储
需求背景众所周知,金融行业有各种各样的财务报表,有些报表涉及到公司财务或经营相关的敏感数据,需要进行加密存储,只有掌握密钥的用户才能看到解密后的数据.注意,这里所说的加密并不是针对整个数据库或者表全 ...
Sublime Text3 注册码（Windows/Build 3176版本）| 开发工具
转自:dushusir.com 1.修改hosts文件(路径:C:\Windows\System32\drivers\etc): 0.0.0.0 www.sublimetext.com 0.0.0.0 ...
JAVASE(十五) 泛型：泛型用例、自定义泛型类、通配符
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 1.泛型在集合中的使用 1.1 在集合中使用泛型之前的例子为什么要有泛型(Generic)? 1. ...
Java实现蓝桥杯算法训练 Anagrams问题
算法训练 Anagrams问题时间限制:1.0s 内存限制:512.0MB 问题描述 Anagrams指的是具有如下特性的两个单词:在这两个单词当中,每一个英文字母(不区分大小写)所出现的次数都是相 ...
Java实现 LeetCode 278 第一个错误的版本
278. 第一个错误的版本你是产品经理,目前正在带领一个团队开发新的产品.不幸的是,你的产品的最新版本没有通过质量检测.由于每个版本都是基于之前的版本开发的,所以错误的版本之后的所有版本都是错的. ...

RocksDB事务的隔离性分析【原创】

RocksDB事务的隔离性分析【原创】的更多相关文章

随机推荐

热门专题