title: 点赞背后的技术大冒险:分布式事务与SAGA模式

date: 2025/05/07 00:12:40

updated: 2025/05/07 00:12:40

author: cmdragon

excerpt:

在微服务架构中,点赞操作涉及多个服务的数据更新,传统数据库事务在分布式系统中失效,需采用SAGA事务模式。SAGA将事务分解为多个本地事务,通过补偿机制保证最终一致性。每个操作需定义对应的补偿操作,补偿操作需幂等,并记录事务状态和实现超时机制。代码实现包括基础模型定义、事务上下文管理器和核心业务逻辑,测试验证正常和异常流程。生产环境中建议添加事务日志、实现定时补偿任务和服务降级策略。

categories:

  • 后端开发
  • FastAPI

tags:

  • 分布式事务
  • SAGA模式
  • 微服务架构
  • 补偿机制
  • Python实现
  • 事务管理
  • 数据库操作


扫描二维码

关注或者微信搜一搜:编程智域 前端至全栈交流与成长

探索数千个预构建的 AI 应用,开启你的下一个伟大创意https://tools.cmdragon.cn/

1. 分布式事务的挑战与解决方案

在微服务架构中,点赞这类看似简单的操作可能涉及多个服务的数据更新。假设我们有两个微服务:

  • 文章服务(存储文章信息和点赞数)
  • 用户服务(记录用户点赞行为)

当用户点赞时,需要同时更新:

  1. 文章服务的点赞计数器
  2. 用户服务的点赞记录

传统数据库事务在分布式系统中失效,我们需要采用SAGA事务模式。这种模式将事务分解为多个本地事务,通过补偿机制保证最终一致性。

2. SAGA事务模式原理

2.1 执行流程示例

正常流程:

[文章服务+1] -> [用户服务创建记录]

异常处理:

[文章服务+1] -> [用户服务失败] -> [文章服务-1补偿]

2.2 补偿机制要点

  • 每个操作必须定义对应的补偿操作
  • 补偿操作需要幂等(重复执行结果一致)
  • 必须记录事务状态
  • 需要实现事务超时机制

3. 实现代码详解

3.1 基础模型定义

# 文章服务模型
class Article(Tortoise.Model):
id = fields.IntField(pk=True)
title = fields.CharField(max_length=255)
likes = fields.IntField(default=0) # 用户服务模型
class UserLikeRecord(Tortoise.Model):
id = fields.UUIDField(pk=True)
user_id = fields.BigIntField()
article_id = fields.BigIntField()
created_at = fields.DatetimeField(auto_now_add=True) # Pydantic响应模型
class LikeResponse(BaseModel):
article_id: int
current_likes: int
user_record_id: UUID

3.2 事务上下文管理器

class SagaTransaction:
def __init__(self):
self.compensation_actions = [] async def __aenter__(self):
return self async def __aexit__(self, exc_type, exc, traceback):
if exc_type is not None:
await self.compensate() def add_compensation(self, coro_func, *args):
self.compensation_actions.append((coro_func, args)) async def compensate(self):
for coro_func, args in reversed(self.compensation_actions):
try:
await coro_func(*args)
except Exception as e:
logging.error(f"Compensation failed: {str(e)}")

3.3 核心业务实现

@app.post("/articles/{article_id}/like", response_model=LikeResponse)
async def like_article(
article_id: int,
user_id: int = Header(..., alias="X-User-ID")
):
async with SagaTransaction() as saga:
# 第一步:更新文章点赞数
article = await Article.get(id=article_id)
original_likes = article.likes
article.likes += 1
await article.save() # 记录补偿操作(回滚点赞数)
saga.add_compensation(
self.compensate_article_likes,
article_id,
original_likes
) # 第二步:创建用户点赞记录
try:
record = await UserLikeRecord.create(
user_id=user_id,
article_id=article_id
)
except Exception as e:
# 自动触发补偿流程
raise HTTPException(500, "Like record creation failed") # 记录补偿操作(删除记录)
saga.add_compensation(
self.compensate_user_record,
record.id
) return LikeResponse(
article_id=article_id,
current_likes=article.likes,
user_record_id=record.id
) # 补偿方法示例
async def compensate_article_likes(article_id: int, original_count: int):
article = await Article.get(id=article_id)
article.likes = original_count
await article.save() async def compensate_user_record(record_id: UUID):
await UserLikeRecord.filter(id=record_id).delete()

4. 测试与验证

4.1 正常流程测试

async def test_successful_like():
async with AsyncClient(app=app, base_url="http://test") as ac:
response = await ac.post(
"/articles/1/like",
headers={"X-User-ID": "123"}
)
assert response.status_code == 200
data = response.json()
assert data["current_likes"] == 1

4.2 异常流程测试

async def test_failed_transaction():
with patch("UserLikeRecord.create", side_effect=Exception("DB Error")):
response = await ac.post(
"/articles/1/like",
headers={"X-User-ID": "123"}
)
assert response.status_code == 500 # 验证补偿是否执行
article = await Article.get(id=1)
assert article.likes == 0

5. 课后Quiz

Q1:为什么补偿操作需要设计为幂等?

A. 提高系统性能

B. 防止重复补偿导致数据错误

C. 减少数据库连接数

D. 满足HTTP协议规范

正确答案:B

解析:网络重试可能导致补偿操作被多次触发,幂等设计确保多次执行结果一致,避免数据不一致。

Q2:以下哪些情况需要触发补偿机制?(多选)

A. 用户服务数据库连接超时

B. 文章不存在返回404错误

C. 用户重复点赞

D. 数据库主从同步延迟

正确答案:A

解析:404属于业务校验错误应在事务开始前检查,重复点赞属于业务逻辑错误,主从同步属于基础架构问题。只有跨服务操作失败需要补偿。

6. 常见报错与解决方案

报错1:TransactionManagementError - 事务已关闭

TransactionManagementError: Transaction already closed

原因:异步上下文管理器中过早关闭数据库连接

解决方案

  1. 检查事务作用域范围
  2. 确保所有数据库操作在同一个事务上下文中
  3. 更新Tortoise-ORM到最新版本

报错2:HTTP 422 Unprocessable Entity

{
"detail": "Field required"
}

原因:请求体缺少必要字段或类型不匹配

解决方案

  1. 检查请求头是否包含X-User-ID
  2. 验证URL参数类型是否正确
  3. 使用Swagger文档测试接口格式

报错3:TimeoutError - 数据库操作超时

TimeoutError: Connection pool exhausted

原因:数据库连接池不足或查询未优化

解决方案

  1. 增加连接池大小配置:
TORTOISE_CONFIG["connections"]["default"]["pool_size"] = 20
  1. 为高频查询字段添加索引
  2. 使用select_related优化关联查询

7. 生产环境建议

  1. 添加事务日志
class TransactionLog(Tortoise.Model):
transaction_id = fields.UUIDField()
service_name = fields.CharField(max_length=50)
action_type = fields.CharField(max_length=20) # main/compensation
status = fields.CharField(max_length=10) # pending/done/failed
created_at = fields.DatetimeField(auto_now_add=True)
  1. 实现定时补偿任务
async def check_hanging_transactions():
# 查找超过5分钟未完成的事务
pending = await TransactionLog.filter(
status="pending",
created_at__lt=datetime.now() - timedelta(minutes=5)
) for transaction in pending:
# 执行补偿逻辑
await retry_compensation(transaction)
  1. 服务降级策略
  • 当连续补偿失败超过阈值时,触发人工干预警报
  • 提供强制完成事务的管理员接口
  • 实现事务状态查询接口供前端展示

(完整示例代码需配合PostgreSQL数据库运行,安装依赖:fastapi uvicorn tortoise-orm httpx python-multipart

余下文章内容请点击跳转至 个人博客页面 或者 扫码关注或者微信搜一搜:编程智域 前端至全栈交流与成长,阅读完整的文章:点赞背后的技术大冒险:分布式事务与SAGA模式 | cmdragon's Blog

往期文章归档:

点赞背后的技术大冒险:分布式事务与SAGA模式的更多相关文章

  1. 分布式事务 Seata Saga 模式首秀以及三种模式详解 | Meetup#3 回顾

    https://mp.weixin.qq.com/s/67NvEVljnU-0-6rb7MWpGw 分布式事务 Seata Saga 模式首秀以及三种模式详解 | Meetup#3 回顾 原创 蚂蚁金 ...

  2. 通过Dapr实现一个简单的基于.net的微服务电商系统(十九)——分布式事务之Saga模式

    在之前的系列文章中聊过分布式事务的一种实现方案,即通过在集群中暴露actor服务来实现分布式事务的本地原子化.但是actor服务本身有其特殊性,场景上并不通用.所以今天来讲讲分布式事务实现方案之sag ...

  3. 分布式事务:Saga模式

    1 Saga相关概念 1987年普林斯顿大学的Hector Garcia-Molina和Kenneth Salem发表了一篇Paper Sagas,讲述的是如何处理long lived transac ...

  4. Dubbo学习系列之十四(Seata分布式事务方案AT模式)

    一直说写有关最新技术的文章,但前面似乎都有点偏了,只能说算主流技术,今天这个主题,我觉得应该名副其实.分布式微服务的深水区并不是单个微服务的设计,而是服务间的数据一致性问题!解决了这个问题,才算是把分 ...

  5. [跨数据库、微服务] FreeSql 分布式事务 TCC/Saga 编排重要性

    前言 FreeSql 支持 MySql/SqlServer/PostgreSQL/Oracle/Sqlite/Firebird/达梦/Gbase/神通/人大金仓/翰高/Clickhouse/MsAcc ...

  6. Dubbo学习系列之十五(Seata分布式事务方案TCC模式)

    上篇的续集. 工具: Idea201902/JDK11/Gradle5.6.2/Mysql8.0.11/Lombok0.27/Postman7.5.0/SpringBoot2.1.9/Nacos1.1 ...

  7. TX-LCN分布式事务之LCN模式

    什么是LCN模式 LCN模式是TX-LCN分布式事务模式的一种,L-lock-锁定事务单元.C-confirm-确认事务模块状态. notify-通知事务单元 原理 LCN模式是通过Spring AO ...

  8. 分布式事务(Seata) 四大模式详解

    前言 在上一节中我们讲解了,关于分布式事务和seata的基本介绍和使用,感兴趣的小伙伴可以回顾一下<别再说你不知道分布式事务了!> 最后小农也说了,下期会带给大家关于Seata中关于sea ...

  9. AspNetCore&MassTransit Courier实现分布式事务

    在之前的一篇博文中,CAP框架可以方便我们实现非实时.异步场景下的最终一致性,而有些用例总是无法避免的需要在实时.同步场景下进行,可以借助Saga事务来解决这一困扰.在一些博文和仓库中也搜寻到了.Ne ...

  10. 关于如何实现一个Saga分布式事务框架的思考

    关于Saga模式的介绍,已经有一篇文章介绍的很清楚了,链接在这里:分布式事务:Saga模式. 关于TCC模式的介绍,也已经有一篇文章介绍的很清楚了,链接在这里:关于如何实现一个TCC分布式事务框架的一 ...

随机推荐

  1. WPF程序性能优化总结

    原文链接: https://blog.csdn.net/u010265681/article/details/77571947 WPF程序性能由很多因素造成,以下是简单地总结: 元素: 1. 减少需要 ...

  2. [NOI2014] 购票 题解

    首先发现 \(p_x\times dis(x,y)+q_x\) 异常像是能斜率优化的样子,那先把求 \(f_x\) 的式子写出来(下设 \(d_x\) 表示 \(x\) 到根的距离): \[f_x=\ ...

  3. 二叉树层次遍历下到上,左到右python

    # 利用队列进行层次遍历就行class TreeNode: def __init__(self, x): self.val = x self.left = None self.right = None ...

  4. Docker安装及卸载小白教程(附基本使用命令)

    第一种:宝塔面板 安装最新版宝塔面板,左侧docker进去安装,等着完成就好 第二种:命令安装 在终端root用户下,依次输入下方指令安装 1.yum包更新到最新 yum update 2.安装需要的 ...

  5. Hive - [01] 概述

    一.Hive是什么 是Facebook开源,用于解决海量结构化日志的数据统计工具. 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能. Hive处理的数 ...

  6. DW - 数据仓库原理

    2023年5月31日 01:13:14,刷B站的时候,刷到了李鹏程大佬的B站作品. 数据仓库的诞生原因 数据仓库的基本概述 数据仓库的特点 数据仓库 vs 数据库 MPP架构 vs 分布式架构 数据仓 ...

  7. 【攻防世界】ez_curl

    ez_curl 题目来源 攻防世界 NO.GFSJ1188 题解 是一个PHP的代码审计 同时还提供了一个附件app.js,打开后内容如下 app.js中: req.query.admin.inclu ...

  8. 深度研究JDK的各种技术细节

    打算建立一个JDK网站,将目前JDK的各种重要特性都深入分析一下.希望JDK中各种技术实现细节都可以在这个网站上查到.相关的模块以及阅读顺序如下图所示. 没有将一些内容规划进来,Java语言基本语法太 ...

  9. Stream4Graph:动态图上的增量计算

    作者:张奇 众所周知,当我们需要对数据做关联性分析的时候,一般会采用表连接(SQL join)的方式完成.但是SQL join时的笛卡尔积计算需要维护大量的中间结果,从而对整体的数据分析性能带来巨大影 ...

  10. iview weapp输入组件input事件顺序

    做小程序,使用ivew weapp组件框架,同时用到了i-input和i-modal,更具体说,就是在modal里面放置了input,填写数据后点击确定,实现提交数据. 出现点小问题,发现是事件顺序导 ...