ORM中的N+1问题
在orm中有一个经典的问题,那就是N+1问题,比如hibernate就有这个问题,这一般都是不可避免的。
【N+1问题是怎么出现的】
N+1一般出现在一对多查询中,下面以Group和User为例,Group和User是一对多的关系。
在sql中如果我们要查询user表中的字段,并需要让每个user都有group表中的信息,也就是多对一查询,
我们可以用如下sql:
select u.*,g.* from user as u left join group as g on u.group_id = g.id;
这样查询出来的user表是附带了group信息的,也就是比如我要查询一个用户,包括他的所属组的信息都可以一条sql查询出来。
而如果反过来呢?我要用查询group,还需要保证group中有user的信息该怎么办呢?
在sql中我们确实可以用right join来解决:
select g.*,u.* from group as g right join user as u on g.id=u.group_id;
这样查询出来的结果表是group的字段在表中是重复的,只有后面拼接的user信息是不一样的。在sql中这样做确实能满足需求,但是在orm中却不能做到。
在orm中,需要对象和数据库对应起来,所以上面的关系在pojo类中大概是这个样子的:
01 |
public class Group{ |
02 |
private List<User> users; |
03 |
04 |
//set |
05 |
//get |
06 |
} |
07 |
08 |
public class User{ |
09 |
private Group group; |
10 |
|
11 |
//set |
12 |
//get |
13 |
} |
如果是开头说的多对一,则问题好解决,咱们orm生成查询语句的时候
select t0.id,t0.name,t0.age,t1.id,t1.group_name from user as t0 left join group as t1......
类似这样,orm会为每个字段和表名生成别名,这样在进行结果包装的时候只需要t0的字段set到user中,将t1的字段set到group中,最后将group对象set到user中,此时就完成包装了,这样查询出的user对象就可以用user.getGroup().getGroupName()来取值了。
如果是一对多,如果使用right join则group信息是重复的,没办法组装一个Group对象以及一个List<User>对象
从而也没办法把List<User> set到Group对象中,也就没法儿组装结果集了。
所以orm一对多查询只能是先将主表Group查询出来,然后将每个group对应的user对象查询出来,伪代码如下:
1、select * from group;--->组装成List<Group>结合
2、for(Group group:groups){
select * from user where group_id = ?(group.getId()) --->组装成List<User> users;
group.setUsers(users)
}
这样就完成一对多的结果组装了。
可以发现如果我们查询出的group有100行数据,那么我们执行的sql语句是1+100条,100条就是循环中执行的。
这样就出现了N+1问题,严重影响了性能,要知道不断得去数据库提交sql请求是很耗性能的,N+1问题并不是只有hibernate有,而是所有orm都会遇到这个问题,只是各自有各自的解决办法提高性能,然后要从根本上解决这个问题是不可能的。
所以使用了orm的情况下要尽量少使用一对多,如果使用的多对一查询,则需要使用左外连接查询,比如hibernate中有fetch="join"可以设置,默认是fetch="select",为什么不是默认前者呢?这是因为hibernate还有懒加载机制,如果fetch="join"的话就不是懒加载了,不管怎样都会即时加载。
hibernate没怎么用过,但原理是这样的。
【怎么解决N+1问题】
上面说了,N+1问题是orm无法避免的问题,所以是无法根治的,只能优化,提高性能。
拿hibernate来说,我们可以关闭一对多的级联抓取,也就是每次都只把Group查询出来,然后循环List<Group>
在使用hibernate的懒加载去查询每个Group对象对应的List<User>属性,这样当没有用到某个group对象的getUsers()方法时是不会去执行查询的。
再者就是使用二级缓存,虽然第一次查询还是N+1,但是以后查询就会变得很快了,因为结果集是直接从缓存中去取的。
【我们的解决办法】
公司正在做自己的orm,我们也有一种解决方案。
上面不是说了吗,查询出group对象的时候需要遍历group,也就一对多在查询出一的一边的时候需要遍历一的结果集去查询多的一遍,
在查询多的一边的时候生成的sql语句是:
1 |
for(int i=0;i<groups.size();i++){ |
2 |
select * from user where group_id = groups.get(i).getId();//伪代码 |
3 |
} |
如果需要循环一百次,我们是不是可以想办法让它只需要循环十次呢?也就是只提交11条sql查询
当然。
1 |
select * from user where group_id = 1 or group_id = 2 or group_id=3.....or group_id = 10;//伪代码 |
这样只需要对groups进行10次循环就可以查询出所有结果,而且在数据库中or是可以使用索引的,所以性能肯定会高,只要不or多了就行。
一直没有完全理解N+1,今天有机会学习了下,欢迎前辈继续深入赐教。
ORM中的N+1问题的更多相关文章
- C#基础系列:实现自己的ORM(反射以及Attribute在ORM中的应用)
反射以及Attribute在ORM中的应用 一. 反射什么是反射?简单点吧,反射就是在运行时动态获取对象信息的方法,比如运行时知道对象有哪些属性,方法,委托等等等等.反射有什么用呢?反射不但让你在运行 ...
- Django ORM 中的批量操作
Django ORM 中的批量操作 在Hibenate中,通过批量提交SQL操作,部分地实现了数据库的批量操作.但在Django的ORM中的批量操作却要完美得多,真是一个惊喜. 数据模型定义 首先,定 ...
- 重构 ORM 中的 Sql 生成
Rafy 领域实体框架设计 - 重构 ORM 中的 Sql 生成 前言 Rafy 领域实体框架作为一个使用领域驱动设计作为指导思想的开发框架,必然要处理领域实体到数据库表之间的映射,即包含了 OR ...
- bbs项目学习到的知识点(orm中的extra)
注册 form组件给input 的标签 添加样式类 参见这篇博客(点击) 上传图像 1.解决 一点击图像就会直接打开上传文件的按钮 #这儿利用了 label标签和input的特殊的联动功能 < ...
- Django ORM中常用字段和参数
一些说明: 表myapp_person的名称是自动生成的,如果你要自定义表名,需要在model的Meta类中指定 db_table 参数,强烈建议使用小写表名,特别是使用MySQL作为后端数据库时. ...
- laravel orm 中的一对多关系 hasMany
个人对于laravel orm 中对于一对多关系的理解 文章表 article,文章自然可以评论,表 comment 记录文章的评论,文章和评论的关系就是一对多,一篇文章可以有多个评论. 在 comm ...
- {Django基础六之ORM中的锁和事务}一 锁 二 事务
Django基础六之ORM中的锁和事务 本节目录 一 锁 二 事务 一 锁 行级锁 select_for_update(nowait=False, skip_locked=False) #注意必须用在 ...
- 优化Django ORM中的性能问题(含prefetch_related 和 select_related)
Django是个好工具,使用的很广泛. 在应用比较小的时候,会觉得它很快,但是随着应用复杂和壮大,就显得没那么高效了.当你了解所用的Web框架一些内部机制之后,才能写成比较高效的代码. 怎么查问题 W ...
- ORM中的一对一和多对多
ORM中的一对一和多对多 Django ORM ORM 一对一 什么时候用一对一? 当 一张表的某一些字段查询的比较频繁,另外一些字段查询的不是特别频繁 把不怎么常用的字段 单独拿出来做成一张表 然 ...
随机推荐
- iOS-UIImageView播放动画
NSArray *gifArray = [NSArray arrayWithObjects:[UIImage imageNamed:@"lanya1"],[UIImage imag ...
- 转:C++中临时对象及返回值优化
http://www.cnblogs.com/xkfz007/articles/2506022.html 什么是临时对象? C++真正的临时对象是不可见的匿名对象,不会出现在你的源码中,但是程序在运行 ...
- Chromium之工程依赖关系.
Chromium各版本可能有差异,我的版本是chromium.r197479,2013/08前后下载的source code. Visual Studio Ultimate版本有工具可以自动生成项目依 ...
- Bjarne Stroustrup语录2
一.致读者 1. 在编程序时,你是在为你针对某个问题的解决方案中的思想建立起一种具体表示.让程序的结构尽可能地直接反映这些思想: ★.如果你能把“它”看成一个独立的概念,就把它做成一个类. ...
- Thread.currentThread().getContextClassLoader().loadClass(className)和Class.forName(className)的区别
一.正文: 有去看开源框架的童鞋,应该会经常看到如下代码:Thread.currentThread().getContextClassLoader().loadClass(className),那这个 ...
- 【python】Python 字典(Dictionary)操作详解
Python字典是另一种可变容器模型,且可存储任意类型对象,如字符串.数字.元组等其他容器模型.一.创建字典字典由键和对应值成对组成.字典也被称作关联数组或哈希表.基本语法如下: dict = {'} ...
- 停课day1
一早上只做了一个calculator 还是参照题解,好惭愧 f[1]=0; flag[1]=true; for (int i=2,N=num[n];i<p;i++) { fo ...
- readelf用法小记
By francis_hao Feb 14,2017 显示ELF文件的信息 用法概述 readelf和objdump类似,不过,readelf会显示更详细的信息,而且独立于BFD库,因此当BFD ...
- 单个回调函数中返回多个Request以及Item
import scrapy from myproject.items import MyItem class MySpider(scrapy.Spider): name = 'example.com' ...
- [NOIp普及组2011]瑞士轮
洛谷题目链接:瑞士轮 题目背景 在双人对决的竞技性比赛,如乒乓球.羽毛球.国际象棋中,最常见的赛制是淘汰赛和循环赛.前者的特点是比赛场数少,每场都紧张刺激,但偶然性较高.后者的特点是较为公平,偶然性较 ...