SQL Server – Soft Delete
前言
Soft Delete 中文叫 "逻辑删", "软删除". 对比的自然就是 Hard Delete.
这篇想聊一聊它的好与坏, 什么时候可以考虑用它.
Hard Delete
在说 soft delete 之前, 我们先来看看 hard delete.
Hard Delete 其实就是普通的 delete 操作. 它是为了与 soft delete 做出区分才刻意叫 hard delete 的.
在和 soft delete 对比下, hard delete 的一些特性被放大了.
1. 一旦执行了 delete, 数据就真的被删除了 (只能通过 SQL Backup, Log 才能回复)
2. Concurrency delete, 执行 delete 操作时, 通过 0 rows affected 判断是否并发.
3. Cascade delete, SQL Server 有自带的 cascade delete 功能, principal 被删除, foreign 也一起被删除
4. Restrict delete, 除了 cascade delete, 也可以设置约束, 一旦有 foreign, principal 就不能被删除. (这个是默认行为)
5. Foreign constraint, 当输入一个不存在的 foreign key, SQL Server 会报错.
除了第一个, 数据不容易被还原以外, 其余的都是好的 feature.
而 soft delete 正是为了解决第一个问题而被提出的.
Step 1: Column Deleted
既然说, 一旦执行了 delete, 数据就真的被删除了, 那就不要执行 delete 咯.
通过增加一个 column 名为 deleted, 然后通过 update deleted = 1 来表示这个 row 已被删除. 这样不就 ok 了吗.
Step 2: Where Deleted = 0
单有表达还不够, 还得有人去理解, SQL Server 自然不可能理解我们的 deleted = 1, 所以接下来, 需要在几乎每一个 table 加上 where 语句
where deleted = 0, 过滤掉已删除的数据.
提醒: 在 inner join 的时候也要过滤哦.
Step 3: Restore Deleted Row
只要把 update deleted = 0 就可以马上还原数据了.
Step 4: Unique Problem
理想很丰满, 现实很骨感. 如果你以为只要付出一点点努力就可以轻松的完成 soft delete, 那就 too young too simple 了.
把"已删除"的数据和普通数据放在一个表内, 第一个会遇到的问题就是 Unique.
因为 SQL Server 并不能智能区分什么数据是已删除的.
第一个想到的方法自然是加一个 filter 在这个 unique 上, filter: deleted = 0
然后你就会发现, 当出现 2 个 deleted and duplicated data 的时候, unique 又报错了.
显然 bool 是没办法解决这个问题的. 使用 DateDeleted 就可以规避这个 unique 的问题了 (总不可能同一个删除时间还能有 duplicated data 了吧)
把 filter 去掉, 在所有 unique 加入 DateDeleted 这个 column. 这样 unique 就不会在撞了.
Step 5: Concurrency Delete
在 hard delete 的情况下, 通过 0 rows affected 来判断是否并发.
在 soft delete 的情况下就不同了, 我们得实现一个 concurrency 的机制, 比如 row version.
Step 6: Cascade Delete
上面说 hard delete 的时候, 有提到一些 SQL Server build-in 的好东西.
但是这些好东西都是基于 hard delete 的, 一旦我们改用 soft delete, 这些 build-in 的机制也跟着没了.
要实现一个 cascade soft delete, 可以使用 trigger.
监听 principal table 的 after update, 如果 DateDeleted 从 null update to not null 那么就表示, 这个 update 是一个 soft delete 操作.
然后跟着 update foreign table 的 DateDeleted 就可以了.
另外, 与 hard delete 不同的是, soft delete 需要被 restore, 如果要实现 cascade delete, 也需要一起实现 cascade restore 才行.
通过判断 principal DateDeleted 从 not null update to null, 可以知道这个 update 是一个 restore 操作.
这里需要注意, 不能单纯的 restore 所有 foreign row 哦, 要考虑到, 可能 foreign row 本来就已经被删除, 而不是被 cascade delete 的.
可以通过时间判断, 如果是相同时间, 那么就是 cascade delete 的. 那么就需要 restore.

GO
CREATE OR ALTER TRIGGER [TR_Contract_AfterUpdate_ForCascadeSoftDelete_Trade] ON [Contract]
AFTER UPDATE
AS
IF (ROWCOUNT_BIG() = 0) RETURN;
SET NOCOUNT ON; UPDATE [Trade]
SET [DeletedBy] =
CASE
-- Delete
WHEN deleted.[DateDeleted] IS NULL AND inserted.[DateDeleted] IS NOT NULL
THEN
CASE
WHEN [Trade].[DateDeleted] IS NOT NULL THEN [Trade].[DeletedBy]
ELSE inserted.[DeletedBy]
END
-- Restore
ELSE
CASE
-- DeletedBy also need to be same
WHEN [Trade].[DateDeleted] = deleted.[DateDeleted] AND [Trade].[DeletedBy] = deleted.[DeletedBy] THEN NULL
ELSE [Trade].[DeletedBy]
END
END,
DateDeleted =
CASE
WHEN deleted.[DateDeleted] IS NULL AND inserted.[DateDeleted] IS NOT NULL
THEN
CASE
WHEN [Trade].[DateDeleted] IS NOT NULL THEN [Trade].[DateDeleted]
ELSE inserted.[DateDeleted]
END
ELSE
CASE
WHEN [Trade].[DateDeleted] = deleted.[DateDeleted] AND [Trade].[DeletedBy] = deleted.[DeletedBy] THEN NULL
ELSE [Trade].[DateDeleted]
END
END
FROM deleted
INNER JOIN inserted
ON deleted.[ContractId] = inserted.[ContractId]
INNER JOIN [Trade] ON inserted.[ContractId] = [Trade].[ContractId]
WHERE (
(deleted.[DateDeleted] <> inserted.[DateDeleted]) or (deleted.[DateDeleted] is null or inserted.[DateDeleted] is null)
)
AND (deleted.[DateDeleted] is not null or inserted.[DateDeleted] is not null)
GO
如果有多个 foreign table, 那么就写多个 trigger.
Step 7: Restrict Delete
Restrict delete 就是当有 foreign 的时候不允许删除 principal. 这个也是 build-in 功能, soft delete 就没了.
同样可以用 trigger 来做. 监听 principal 的 update, 发现是 delete 操作, 先查看是否有相关的 foreign row. 有的话就报错.
GO
CREATE OR ALTER TRIGGER [TR_Trade_AfterUpdate_ForRestrictSoftDelete_TradeItem] ON [Trade]
AFTER UPDATE
AS
IF (ROWCOUNT_BIG() = 0) RETURN;
SET NOCOUNT ON;
-- Check have non-deleted children
IF EXISTS (
-- 这里不需要锁表, 是因为 foreign insert/update 会锁
SELECT 1 FROM deleted INNER JOIN inserted ON deleted.[TradeId] = inserted.[TradeId]
INNER JOIN [TradeItem] ON inserted.[TradeId] = [TradeItem].[TradeId]
WHERE (
(deleted.[DateDeleted] <> inserted.[DateDeleted]) or (deleted.[DateDeleted] is null or inserted.[DateDeleted] is null)
)
AND (deleted.[DateDeleted] is not null or inserted.[DateDeleted] is not null)
AND [TradeItem].[DateDeleted] IS NULL
)
BEGIN
;THROW 50001, 'Restrict Soft Delete', 0;
END
GO
如果有多个 foreign table, 那么就写多个 trigger
Step 8: Foreign constraint
Foreign constraint 是站在 foreign 的角度, 当 insert/update 时, 需要确保 foreign key relate to principal row 必须存在于 database.
这也是一个 build-in 功能, 由于 soft delete 并不会真的删除数据, 意味着 build-in 的 foreign constraint 是不需要的, 可以关掉它, 节约性能.
但是 foreign constraint 这个概念可不能关掉哦, soft delete 依然需要有这个机制, 我们得自己实现一个.
当 foreign insert/update 时, 通过 trigger 去检查确保 principal row 不是 deleted 状态, 如果是 deleted 就报错.
注: 这过程还需要提升隔离等级哦, 需要 repeatable read (防止并发问题)

-- Foreign constraint check when foreign insert
GO
CREATE OR ALTER TRIGGER [TR_TradeItem_AfterUpdate_ForRestrictSoftDelete_TradeItem] ON [TradeItem]
AFTER UPDATE
AS
IF (ROWCOUNT_BIG() = 0) RETURN;
SET NOCOUNT ON; -- Check current isolation level and keep it, if later set then need to reset back.
DECLARE @currentIsolationLevel nvarchar(64); SELECT @currentIsolationLevel =
CASE transaction_isolation_level
WHEN 0 THEN 'Unspecified'
WHEN 1 THEN 'READ UNCOMMITTED'
WHEN 2 THEN 'READ COMMITTED'
WHEN 3 THEN 'REPEATABLE READ'
WHEN 4 THEN 'SERIALIZABLE'
WHEN 5 THEN 'SNAPSHOT'
END
FROM sys.dm_exec_sessions
WHERE session_id = @@SPID; DECLARE @isolationChanged bit = 0; -- record whether change isolation
IF(@currentIsolationLevel <> 'REPEATABLE READ' AND @currentIsolationLevel <> 'SERIALIZABLE')
BEGIN
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SET @isolationChanged = 1;
END -- 1 foreign key 1 @count, so can be more than 1
DECLARE @count int; SELECT @count = SUM(CASE WHEN [Trade].[DateDeleted] IS NOT NULL THEN 1 ELSE 0 END)
FROM deleted INNER JOIN inserted ON deleted.[TradeItemId] = inserted.[TradeItemId]
LEFT JOIN [Trade] ON inserted.[TradeId] = [Trade].[TradeId]
WHERE (
(deleted.[TradeId] <> inserted.[TradeId]) or (deleted.[TradeId] is null or inserted.[TradeId] is null)
)
AND (deleted.[TradeId] is not null or inserted.[TradeId] is not null); IF(@isolationChanged = 1) -- reset back isolation level
BEGIN
EXEC('SET TRANSACTION ISOLATION LEVEL ' + @currentIsolationLevel);
END IF(@count > 0)
BEGIN
;THROW 50001, 'Restrict Soft Delete', 0;
END
GO -- Foreign constraint check when foreign update foreign key
GO
CREATE OR ALTER TRIGGER [TR_TradeItem_AfterInsert_ForRestrictSoftDelete_TradeItem] ON [TradeItem]
AFTER INSERT
AS
IF (ROWCOUNT_BIG() = 0) RETURN;
SET NOCOUNT ON; DECLARE @currentIsolationLevel nvarchar(64);
SELECT @currentIsolationLevel =
CASE transaction_isolation_level
WHEN 0 THEN 'Unspecified'
WHEN 1 THEN 'READ UNCOMMITTED'
WHEN 2 THEN 'READ COMMITTED'
WHEN 3 THEN 'REPEATABLE READ'
WHEN 4 THEN 'SERIALIZABLE'
WHEN 5 THEN 'SNAPSHOT'
END
FROM sys.dm_exec_sessions
WHERE session_id = @@SPID; DECLARE @isolationChanged bit = 0;
IF(@currentIsolationLevel <> 'REPEATABLE READ' AND @currentIsolationLevel <> 'SERIALIZABLE')
BEGIN
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SET @isolationChanged = 1;
END DECLARE @count int; SELECT @count = SUM(CASE WHEN [Trade].[DateDeleted] IS NOT NULL THEN 1 ELSE 0 END) FROM inserted
LEFT JOIN [Trade] ON inserted.[TradeId] = [Trade].[TradeId]; IF(@isolationChanged = 1)
BEGIN
EXEC('SET TRANSACTION ISOLATION LEVEL ' + @currentIsolationLevel);
END IF(@count > 0)
BEGIN
;THROW 50001, 'Restrict Soft Delete', 0;
END
GO
Step 9: Table Structure
当某个 column 从 nullable 变成 not nullable 的时候, soft deleted 的 row 就会成为麻烦.
因为需要设置 default value 给它们. 另外如果某个 column 要删除掉, 也意味着 soft deleted 的资料也需要被删除掉.
所以你的历史记录并不能完全的被保存起来. 这个基本上是无解的.
We really need soft delete?
从上面的 Step 可以看出来要实现一个完整的 soft delete 代价还是挺大的, 不管是开发, 维护, 性能等等.
所以让我们回到需求的本质.
需求 1, 我们希望数据永远不要真的 delete 掉, 因为你不知道会不会有那么一天, 你突然后悔了.
需求 2, 还原数据的速度. 如果满足了第一个需求, 那么可能进一步希望能快速还原.
一般上第 1 个需求会比第 2 个重要很多.
从这 2 个点看的话, 上面的 Soft Delete 对第 2 个需求满足的很好, 但是对第 1 个需求就不那么理想了.
所以 Soft Delete 并不是一个很划算的方案.
Soft Delete Alternative
Temporal Table
要完整的保留所有数据. 那么自然不能放过 update 的数据. 不只是 delete 可以销毁数据, update 也可以丫.
SQL Server 的 Temporal Table 也是一个为了满足上面 2 个需求而诞生的.
在数据保护上, 它比 soft delete 要强, 在恢复数据上, 它弱于 soft delete 一些, 在开发和维护上它是 build-in solution 更好一些. 性能都差不多.
但是它算是一个比较重的方案. 所以如果没有充分利用到它最大的特性 (time travel) 我认为依然不算是合适的方案.
Archive Table or Data Log Table
这个方案基本上是放弃了快速还原的需求, 把重心放到数据保护上. 它比 soft delete 简单很多.
做一个表, 做 trigger 监听每个表的 delete/update, 把 deleted 的 row to json 然后存入 archive table 中.
与 soft delete 和 temporal table 相比, 把所有 history 都放入一个表中的好处就是不需要担心 table structure change.
当然坏处可能就是需要 query by json, 性能可能慢一些.
总体来看这个方案依然是比较合适的.
总结
不要真的删除数据, 这个是对的, 如何实现这个需求则有许多地方需要考虑.
soft delete 的简单是站在前面 3 个 Step 说的, 越往后问题越多.
我观察 Microsoft Azure, Google Cloud 它们在实现 Soft Delete 的时候是很有控制的.
比如,
unique 依然存在, 你需要另外取名字, 或者关闭 soft delete 去 hard delete 才可以用回同一个名字
soft delete 只保留 30-90 days, 这样就不会因为数据太多而影响性能, 也不会因为 table structure change 而一直被影响着 (有个周期, 最多也是一个时间内比较混乱)
只有少数 table 有 soft delete, 只有真的需要 delete 和快速 restore 的地方, 它们才会考虑使用 soft delete.
所以我个人的建议是, 要用 soft delete 就要清楚它的利与弊, 要避短扬长. 千万不要认为世界上所有问题都有银弹. 想一招打天下. 越往后你会越痛苦的.
SQL Server – Soft Delete的更多相关文章
- SQL Server中DELETE和TRUNCATE的区别
DELETE和TRUNCATE语句之间的区别是求职面试中最常见的问题之一.这两条语句都可以从表中删除数据.然而,也有不同之处. 本文将重点讨论这些差异,并通过实例加以说明. TRUNCATE DEL ...
- SQL Server中Delete语句表名不能用别名
delete from TABLEA A where A.FIELD1=10 (ORACLE适用)delete TABLEA from TABLEA A where A.FIELD1=1 ...
- 追踪SQL Server执行delete操作时候不同锁申请与释放的过程
一直以为很了解sqlserver的加锁过程,在分析一些特殊情况下的死锁之后,尤其是并发单表操作发生的死锁,对于加解锁的过程,有了一些重新的认识,之前的知识还是有一些盲区在里面的.delete加锁与解锁 ...
- SQL Server 后悔药 delete drop update
国庆假期终于有时间做点事情 因为平常工作会做些数据库操作 可能会有所操作失误 参考一下 方法一 ApexSql 2016一个软件 http://www.cnblogs.com/gsyifan/p/A ...
- sql server 测试delete后数据空间情况
总结结论: [1]如果是索引组织表,删除的数据空间是会被文件设置为可用状态,其他表都可以使用. [2]如果是堆表,删除数据空间也会设置为可用状态,但是只能给被删除数据的表使用. [3]truncate ...
- SQL Server温故系列(1):SQL 数据操作 CRUD 之增删改合
1.插入语句 INSERT INTO 1.1.用 INSERT 插入单行数据 1.2.用 INSERT 插入多行数据 1.3.用 INSERT 插入子查询结果行 1.4.INSERT 小结及特殊字段插 ...
- SQL SERVER 2005删除维护作业报错:The DELETE statement conflicted with the REFERENCE constraint "FK_subplan_job_id"
案例环境: 数据库版本: Microsoft SQL Server 2005 (Microsoft SQL Server 2005 - 9.00.5000.00 (X64) ) 案例介绍: 对一个数据 ...
- SQL Server DML(UPDATE、INSERT、DELETE)常见用法(一)
1.引言 T-SQL(Transact Structured Query Language)是标准的SQL的扩展,是程序和SQL Server沟通的主要语言. T-SQL语言主要由以下几部分组成: 数 ...
- SQL Server中UPDATE和DELETE语句结合INNER/LEFT/RIGHT/FULL JOIN的用法
在SQL Server中,UPDATE和DELETE语句是可以结合INNER/LEFT/RIGHT/FULL JOIN来使用的. 我们首先在数据库中新建两张表: [T_A] CREATE TABLE ...
- SQL Server INSET/UPDATE/DELETE的执行计划
DML操作符包括增删改查等操作方式. insert into Person.Address (AddressLine1, AddressLine2, City, StateProvinceID, Po ...
随机推荐
- PN转Modbus RTU模块连接ACS4QQ变频器通信
一台完整的机器在出厂前由许多部件组成.但是,由于各种原因,这些组件来自不同的制造商,导致设备之间的通信协议存在差异.Modbus和Profinet代表两种不同的通信协议,Profinet通常用于较新的 ...
- CF452C 题解
洛谷链接&CF 链接 题目简述 有 \(m \times n\) 张牌,有 \(n\) 个种类,每个种类有 \(m\) 张,现在抽一张放回,再抽一张,求这张牌与第一张抽出的牌种类相同的概率. ...
- [rCore学习笔记 02]Ubuntu 22虚拟机安装
写在前面 本随笔是非常菜的菜鸡写的.如有问题请及时提出. 可以联系:1160712160@qq.com GitHhub:https://github.com/WindDevil (目前啥也没有 Ubu ...
- 使用后台模板,cnpm install报错
- 对比python学julia(第一章)--(第六节)数字黑洞
6.1. 问题描述 6174数字黑洞是印度数学家卡普雷卡尔于1949年发现的,又称为卡普雷卡尔黑洞,其规则描述如下. 任意取一个4位的整数(4个数字不能完全相同),把4个数字由大到小排列成一个大的数, ...
- 【Spring】01 快速入门
Spring快速入门 空Maven项目创建 声明工程名称,完成 删除SRC目录,创建01 HelloSpring模块 导入依赖 Maven坐标: <!-- https://mvnreposito ...
- 【Git】04 文件删除
版本分支的概念提示: 工作区就是我们的Git本地仓库,也就是一个很普通的目录 . 通过ADD指令添加文件到暂存区中, 在通过COMMIT指令提交到版本分支, 所谓的版本分支,就是就是这个蓝色的Mast ...
- Ubuntu系统下python模块graphviz运行报错:graphviz.backend.execute.ExecutableNotFound: failed to execute PosixPath(‘dot‘)
代码中需要运行python模块graphviz,安装: pip install graphviz 运行后报错: graphviz.backend.execute.ExecutableNotFound: ...
- npm WARN config global `--global`, `--local` are deprecated. Use `--location 的解决方法
1.背景 2.解决步骤 2.1.找到nodejs的安装路径 2.2.修改配置文件 将文件里的 prefix-g 改为 prefix --location=global 修改前: 修改后: 点击保存就解 ...
- spring之事务详解
1.背景 该博客要解决的重要问题如下: spring的3种安全性问题,4种事务特性,5种隔离级别,7种传播行为 spring的3种安全性问题,4种事务特性,5种隔离级别,7种传播行为 spring事务 ...