我们在定义SQLAlchemy对象模型的关系的时候,用到了relationship 来标识关系,其中 lazy 的参数有多种不同的加载策略,本篇随笔介绍它们之间的关系,以及在异步处理中的一些代码案例。

1、在 SQLAlchemy 中定义关系

在 SQLAlchemy 中,relationship() 函数用于定义表之间的关系(如 one-to-manymany-to-onemany-to-many 等)。它支持许多参数来控制如何加载和处理关联的数据。以下是一些常用的 relationship() 参数及其说明:

1. lazy

  • 作用: 控制如何加载关联数据。
  • 可选值:
    • 'select': 延迟加载。访问关系属性时,发送一个独立的查询来获取关联数据(默认值)。
    • 'selectin': 使用 IN 查询批量加载关联对象,避免 n+1 查询问题。
    • 'joined': 使用 JOIN 直接在主查询中加载关联数据。
    • 'subquery': 使用子查询来批量加载关联对象。
    • 'immediate': 在加载主对象后,立即加载关联对象。
    • 'dynamic': 仅适用于 one-to-many,返回一个查询对象,可以进一步过滤或操作关联数据。
  • 详细说明

  在SQLAlchemy中,lazy是一个定义ORM关系如何加载的参数,主要用于控制关联关系(如one-to-manymany-to-one等)在访问时的加载方式。

1)lazy='select' (默认)

  • 说明: 这是最常见的方式,使用"延迟加载"策略。当访问关联属性时,SQLAlchemy会发送一条新的SQL查询来加载相关数据。
  • 优点: 避免了不必要的查询,节省资源。
  • 缺点: 当你访问多个关联对象时,可能会导致"n+1查询问题",即每次访问关联数据时都会发出新的SQL查询。

2) lazy='selectin'

  • 说明: 类似于lazy='select',但通过IN语句批量查询相关对象。SQLAlchemy会在一次查询中批量获取多个对象的关联数据,而不是为每个对象单独查询。
  • 优点: 解决了"n+1查询问题",效率高于select
  • 缺点: 适用于可以通过IN语句高效查询的场景,但如果结果集非常大,可能会影响性能。

3) lazy='joined'

  • 说明: 在主查询时,使用JOIN语句直接加载关联对象。这意味着关联对象在查询时就会被立即加载,不需要额外的查询。
  • 优点: 避免了多个SQL查询,适合在同一查询中需要大量关联数据的场景。
  • 缺点: 如果JOIN的表数据较多,可能会导致查询结果变得复杂且性能下降。

4)lazy='immediate'

  • 说明: 在加载主对象时,立即加载所有关联对象。与select类似,但是在主对象加载后,马上发送查询请求加载关联对象。
  • 优点: 保证在对象加载后立刻有完整的数据。
  • 缺点: 对每个关联的对象仍然会发送单独的查询,可能造成"n+1查询问题"。

5)lazy='subquery'

  • 说明: 使用子查询来加载关联对象。SQLAlchemy会在查询主对象时生成一个子查询,以批量加载相关对象。
  • 优点: 避免了"n+1查询问题",适合处理大型数据集。
  • 缺点: 子查询可能会导致查询效率降低,特别是在复杂的查询场景中。

6)lazy='dynamic'

  • 说明: 仅适用于one-to-many关系,返回一个查询对象,而不是实际的结果集。你可以通过调用查询对象来进一步过滤或操作关联对象。
  • 优点: 非常灵活,可以根据需要随时查询关联对象。
  • 缺点: 不能使用通常的方式访问关联属性,必须通过查询进一步获取数据。

2. backref

  • 作用: 定义反向引用,允许从关联表访问当前表。

  • 用法: 通过 backref,可以在关联的表中自动生成一个反向关系,避免手动定义双向关系。

  • 示例:

class Parent(Base):
__tablename__ = 'parent'
id = Column(Integer, primary_key=True)
children = relationship("Child", backref="parent") class Child(Base):
__tablename__ = 'child'
id = Column(Integer, primary_key=True)
parent_id = Column(Integer, ForeignKey('parent.id'))

3. back_populates

  • 作用: 手动定义双向关系时,使用 back_populates 来明确地表示两个表之间的相互关系。

  • 示例:

class Parent(Base):
__tablename__ = 'parent'
id = Column(Integer, primary_key=True)
children = relationship("Child", back_populates="parent") class Child(Base):
__tablename__ = 'child'
id = Column(Integer, primary_key=True)
parent_id = Column(Integer, ForeignKey('parent.id'))
parent = relationship("Parent", back_populates="children")

4. cascade

  • 作用: 定义级联操作,决定在父对象上进行操作时,是否自动对关联的子对象进行相应操作。

  • 常见值:

    • 'save-update': 当父对象被保存或更新时,子对象也会被保存或更新。
    • 'delete': 当父对象被删除时,子对象也会被删除。
    • 'delete-orphan': 当子对象失去与父对象的关联时,子对象将被删除。
    • 'all': 包含所有级联操作。
  • 示例:

children = relationship("Child", cascade="all, delete-orphan")

5. uselist

  • 作用: 控制关联属性是否返回一个列表。适用于 one-to-oneone-to-many 关系。

  • 用法:

    • True: 返回一个列表(适用于 one-to-many,默认值)。
    • False: 返回单个对象(适用于 one-to-one)。
  • 示例:

parent = relationship("Parent", uselist=False)  # one-to-one 关系

6. order_by

  • 作用: 定义关联对象的排序方式。

  • 示例:

children = relationship("Child", order_by="Child.name")

7. foreign_keys

  • 作用: 显式指定哪些列是用于定义关联关系的外键,适用于存在多个外键的场景。

  • 示例:

parent = relationship("Parent", foreign_keys="[Child.parent_id]")

8. primaryjoin

  • 作用: 明确定义关联关系的连接条件,通常在 SQLAlchemy 无法自动推断时使用。

  • 示例:

parent = relationship("Parent", primaryjoin="Parent.id == Child.parent_id")

9. secondary

  • 作用: 定义多对多(many-to-many)关系时,指定关联的中间表。

  • 示例:

class Association(Base):
__tablename__ = 'association'
parent_id = Column(Integer, ForeignKey('parent.id'))
child_id = Column(Integer, ForeignKey('child.id')) children = relationship("Child", secondary="association")

10. secondaryjoin

  • 作用: 定义 secondary 表中的关联条件,通常用于复杂的多对多关系。

  • 示例:

children = relationship("Child", secondary="association",
secondaryjoin="Child.id == Association.child_id")

11. viewonly

  • 作用: 定义只读的关系,不允许通过此关系修改数据。

  • 示例:

children = relationship("Child", viewonly=True)

12. passive_deletes

  • 作用: 控制删除时的行为。如果设置为 True,SQLAlchemy 不会主动删除关联对象,而是依赖数据库的级联删除。

  • 示例:

children = relationship("Child", passive_deletes=True)

这些参数可以根据具体的业务需求和场景进行调整,以优化查询和数据管理策略。

2、用户角色表的关系分析

在实际业务中,机构和用户是多对多的关系的,我们以机构表定义来进行分析它们的关系信息。

如机构表的模型定义大致如下。

class Ou(Base):
"""机构(部门)信息-表模型"""
__tablename__ = "t_acl_ou"
id = Column(Integer, primary_key=True, comment="主键", autoincrement=True)
pid = Column(Integer, ForeignKey("t_acl_ou.id"), comment="父级机构ID", default="-1")
handno = Column(String, comment="机构编码")
name = Column(String, comment="机构名称") # 定义 parent 关系
parent = relationship(
"Ou", remote_side=[id], back_populates="children", lazy="immediate"
)
# 定义 children 关系
children = relationship("Ou", back_populates="parent", lazy="immediate")
# 定义 users 关系
users = relationship(
"User", secondary="t_acl_ou_user", back_populates="ous", lazy="select"
)

我们可以看到其中加载的多对多关系是采用lazy=select的方式的。

当你使用 await session.get(Ou, ou_id) 来获取一个 Ou 对象后,访问其关系属性(如 ou.users)时,可能会遇到异步相关的问题。原因是,SQLAlchemy 的异步会话需要使用 selectinload 或其他异步加载选项来确保在异步环境中正确地加载关联数据。

在默认的 lazy='select' 关系中,加载关系对象会触发一个同步查询,而这与异步会话不兼容,导致错误。为了解决这个问题,你需要确保关系的加载是通过异步的方式进行的。

解决方法:

1. 使用 selectinload 进行预加载

在查询时,显式地通过 selectinload 来加载关联的 users 关系:

from sqlalchemy.orm import selectinload

ou = await session.get(Ou, ou_id, options=[selectinload(Ou.users)])

# 现在你可以访问 ou.users,关系对象已经被异步加载
print(ou.users)

2. 使用 lazy='selectin' 或其他异步兼容的加载策略

你还可以在定义模型的关联关系时,将 lazy='selectin' 设置为默认的加载方式,这样当访问关联属性时,SQLAlchemy 会自动使用异步兼容的加载机制:

class Ou(Base):
__tablename__ = 'ou'
id = Column(Integer, primary_key=True)
users = relationship("User", lazy='selectin') # 使用 selectin 异步加载 ou = await session.get(Ou, ou_id)
print(ou.users) # 关联对象可以正常异步访问

总结:

  • 在异步环境中访问关系对象时,如果使用了同步的 lazy='select',会导致异步不兼容问题。
  • 解决方案是通过查询时使用 selectinload 或将关系的 lazy 属性设置为异步兼容的选项,如 selectin

因此,如果机构和用户的关系信息,我们可以通过selectload关系实现加载,也可以考虑使用中间表的关系进行获取,如下代码所示:获取指定用户的关联的机构列表.

    async def get_ous_by_user(self, db: AsyncSession, user_id: str) -> list[int]:
"""获取指定用户的关联的机构列表"""
# 方式一,子查询方式
stmt = select(User).options(selectinload(User.ous)).where(User.id == user_id)
result = await db.execute(stmt)
user = result.scalars().first()
ous = user.ous if user else [] # 方式二,关联表方式
# stmt = (
# select(Ou)
# .join(user_ou, User.id == user_ou.c.user_id)
# .where(user_ou.c.user_id == user_id)
# )
# result = await db.execute(stmt)
# ous = result.scalars().all() ouids = [ou.id for ou in ous]
return ouids

上面两种方式是等效的,一个是通过orm关系进行获取关系集合,一个是通过中间表的关系检索主表数据集合。

通过中间表,我们也可以很方便的添加角色的关系,如下面是为角色添加用户,也就是在中间表进行处理即可。

    async def add_user(self, db: AsyncSession, role_id: int, user_id: int) -> bool:
"""添加角色-用户关联"""
stmt = select(user_role).where(
and_(
user_role.c.role_id == role_id,
user_role.c.user_id == user_id,
)
) if not (await db.execute(stmt)).scalars().first():
await db.execute(
user_role.insert().values(role_id=role_id, user_id=user_id)
)
await db.commit()
return True return False

当然。如果我们不用这种中间表的处理方式,也是可以使用常规多对多关系进行添加处理,不过需要对数据进行多一些检索,也许性能会差一些。

    async def add_user(self, db: AsyncSession, ou_id: int, user_id: int) -> bool:
"""给机构添加用户"""
# 可以使用下面方式,也可以使用中间表方式处理
# 先判断用户是否存在
user = await db.get(User, user_id)
if not user:
return False # 再判断机构是否存在
result = await db.execute(
select(Ou).options(selectinload(Ou.users)).filter_by(id=ou_id)
)
# await db.get(Ou, ou_id) #这种方式不能获得users,因为配置为selectin
# await db.get(Ou, ou_id, options=[selectinload(Ou.users)]) # 这种方式可以获得users
ou = result.scalars().first()
if not ou:
return False # 再判断用户是否已经存在于机构中
if user in ou.users:
return False # 加入机构
ou.users.append(user)
await db.commit()
return True

在 SQLAlchemy 中对数据异步处理的时候,获得关联集合的处理方式的更多相关文章

  1. 将前台input中的数据异步传到后台并存入数据库

    将前台input中的数据异步传到后台并存入数据库 先看图: 利用ajax异步交互数据,并不是以json数组的形式将数据传到后台,而是利用字符数组的形式将其传到后台.动态新增每一行数据,将每一列对应的数 ...

  2. vue-awesome-swiper中的数据异步加载

    <template> <div> //第一个轮播 加了v-if 判断,可以实现 loop 轮循 <swiper v-if="gglist.length>1 ...

  3. Vue 在beaforeCreate时获取data中的数据

    众所周知,vue在beforecreate时期是获取不到data中的 数据的 但是通过一些方法可以实现在beforecreate时获取到data中的数据 暂时想到两种放发可以实现,vue在before ...

  4. C#-WinForm-ListView-表格式展示数据、如何将数据库中的数据展示到ListView中、如何对选中的项进行修改

    在展示数据库中不知道数量的数据时怎么展示最好呢?--表格 ListView - 表格形式展示数据 ListView 常用属性 HeaderStyle - "详细信息"视图中列标头的 ...

  5. ajax异步获取数据后动态向表格中添加数据(行)

    因为某些原因,项目中突然需要做自己做个ajax异步获取数据后动态向表格中添加数据的页面,网上找了半天都没有 看到现成的,决定自己写个例子 1.HTML页面 <!doctype html> ...

  6. flask SQLAlchemy中一对多的关系实现

    SQLAlchemy是Python中比较优秀的orm框架,在SQLAlchemy中定义了多种数据库表的对应关系, 其中一对多是一种比较常见的关系.利用flask sqlalchemy实现一对多的关系如 ...

  7. 爱上MVC3~MVC+ZTree大数据异步树加载

    回到目录 理论部分: MVC+ZTree:指在.net MVC环境下进行开发,ZTree是一个jquery的树插件 大数据:一般我们系统中,有一些表结构属于树型的,如分类,地域,菜单,网站导航等等,而 ...

  8. Chrome扩展开发之三——Chrome扩展中的数据本地存储和下载

    目录: 0.Chrome扩展开发(Gmail附件管理助手)系列之〇——概述 1.Chrome扩展开发之一——Chrome扩展的文件结构 2.Chrome扩展开发之二——Chrome扩展中脚本的运行机制 ...

  9. android的progressDialog 的使用。android数据异步加载 对话框提示

    在调用的Activity中定义一个全局的 progressDialog 点击按钮的时候调用下面这句 progressDialog = ProgressDialog.show(SearchActivit ...

  10. IOS学习:ios中的数据持久化初级(文件、xml、json、sqlite、CoreData)

    IOS学习:ios中的数据持久化初级(文件.xml.json.sqlite.CoreData) 分类: ios开发学习2013-05-30 10:03 2316人阅读 评论(2) 收藏 举报 iOSX ...

随机推荐

  1. Class 与 Style 如何动态绑定?

    Class 可以通过对象语法和数组语法进行动态绑定: 对象语法: <div v-bind:class="{ active: isActive, 'text-danger': hasEr ...

  2. PHP函数http_build_query使用详解

    什么是http_build_query? 使用给出的关联(或下标)数组生成一个经过 URL-encode 的请求字符串.参数 formdata 可以是数组或包含属性的对象.一个 formdata 数组 ...

  3. 拯救SQL Server数据库事务日志文件损坏的终极大招

    拯救SQL Server数据库事务日志文件损坏的终极大招 在数据库的日常管理中,我们不可避免的会遇到服务器突然断电(没有进行电源冗余),服务器故障或者 SQL Server 服务突然停掉, 头大的是l ...

  4. 对比`Pinia `和` Vuex`,全面了解` Vue`状态管理

    Pinia和Vuex一样都是是vue的全局状态管理器.其实Pinia就是Vuex5,只不过为了尊重原作者的贡献就沿用了这个看起来很甜的名字Pinia. 本文将通过Vue3的形式对两者的不同实现方式进行 ...

  5. 树莓派配置固定IP地址

    树莓派配置固定IP地址 1.编辑文件/etc/dhcpcd.confroot@raspberrypi:~# vi /etc/dhcpcd.conf 2.修改以下参数配置,如果没有就在文件底部添加有线配 ...

  6. 仓颉编程语言技术指南:嵌套函数、Lambda 表达式、闭包

    本文分享自华为云社区<[华为鸿蒙开发技术]仓颉编程语言技术指南[嵌套函数.Lambda 表达式.闭包]>,作者:柠檬味拥抱. 仓颉编程语言(Cangjie)是一种面向全场景应用开发的通用编 ...

  7. springboot3整合高版本spring data neo4j

    本博客适用于springboo data neo4j 7.2.6版本,详情阅读官网https://docs.spring.io/spring-data/neo4j/reference/7.2/intr ...

  8. 【Java-GUI】04 菜单

    --1.菜单组件 相关对象: MenuBar 菜单条 Menu 菜单容器 PopupMenu 上下文菜单(右键弹出菜单组件) MenuItem 菜单项 CheckboxMenuItem 复选框菜单项 ...

  9. 何时使用交叉熵,何时使用KL散度:计算分布差距为啥使用KL散度而不用交叉熵,计算预测差距时为啥使用交叉熵而不用KL散度

    问题: 何时使用交叉熵,何时使用KL散度? 计算分布差距为啥使用KL散度而不用交叉熵,计算预测差距时为啥使用交叉熵而不用KL散度 问题很大,答案却很简单. 答案: 熵是一种量度,是信息不确定性的量度: ...

  10. NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)—— 到底实现了什么功能,意义价值又是什么???

    相关内容: NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装--强化学习的仿真训练环境 ================================ ...