前言

前几天上午在对数据库的一张表进行操作的时候，由于这张表是按照时间的一张统计表，正好到那天没有测试数据了，于是我想将表中所有的时间，统一更新到后一个月，于是对80w条数据的更新开始了。整个过程曲折的一批。同时学到了很多知识，在此进行记录。希望对大家有帮助。

首先是大批量更新，由于数据已经进行了分区，开始对分区进行分析，然后大批量操作死锁，对死锁的解决，最后存储过程来解决数据的大批量插入。

曲折的过程开始

由于测试数据到21号就没了，21号一上去，发现开发的功能，都没有数据了，图表也都空了。查询原因发现测试数据没了。于是打算开始造数据。此时数据库已经有80多w的数据，当时想着将所有数据的collect_time时间字段向后推迟一个月，即可。当时也没想优化问题。于是写下sql。

update i_people_collect set collect_time = collect_time+30

此sql将表的所有时间向后推迟一个月。于是开始执行。

此时报错：ORA-14402: 更新分区关键字列将导致分区的更改。

于是发现此表的collect_time列进行了分区处理。

我们可以先开启表的行移动来允许对分区字段的update 操作。sql如下

alter table xxx enable row movement;

之后再执行update发现可以执行，执行完毕后，记得关闭行移动。

alter table xxx disable row movement;

回到刚才我们执行update语句，预计会慢，但是发现执行了20分钟还没有结束。于是怀疑报错了。就强行终止。但是此时终止也不好使了。。大概是占用资源太多，不好释放。

于是强行关掉pl/sql。重新登录。这里我们先分析一下，执行update操作为什么会这么慢。

分区表某一行更新时，如果更新的是分区列，并且更新后的列值不属于原来的这个分区，如果开启了这个选项，就会把这行从这个分区中delete掉，并加到更新后所属的分区。相当于一个隐式的delete+insert，但是不会触发insert/delete触发器。如果没有开启这个选项，就会在更新时报错 ORA-14402;

这一操作产生影响的特殊之处在于这是个DML操作，是和online transaction密切相关。对于这样一个UPDATE，实际上分为3步：先从原有分区将数据删除;将原数据转移到新分区上;更新数据。

其影响就在于以下几个方面：

一个UPDATE被分解为DELET、INSERT、UPDATE三个操作，增加了性能负担。其中，DELETE的查询条件与原UPDATE的查询条件相同，新的UPDATE的查询条件是基于INSERT生成的新的ROWID，相应的Redo Log、Undo Log会增加;

如果Update语句还涉及到了Local Index的字段的话，新、旧2个分区上的Local Index都要被更新。

由于我们更新的是collect_time列。collect_time列又正好是分区列。于是就产生了上面的这种情况。造成执行速度十分的缓慢。

原因分析完毕。继续说接下来发生的问题。

重新连接到PL/Sql后，对刚才的表进行查询，发现一直执行sql，并不返回结果。于是考虑刚才的sql还在执行的问题。

通过pl/sql的工具，会话，发现刚才的会话仍然存在，没有断开连接。这就坑爹了啊。通过会话来对连接强制结束。发现还是不能操作刚才的表。于是考虑了一下，可能是表发生了死锁。

于是执行查询哪些表产生了死锁的sql，如下

select b.owner,b.object_name,a.session_id,a.locked_mode from v$locked_object a,dba_objects b where b.object_id = a.object_id;

通过结果发现，刚才的表果然已经被锁定了。

继续向下看是哪个用户的哪个进程造成的死锁

--查看那个用户那个进程照成死锁

select b.username,b.sid,b.serial#,logon_time from v$locked_object a,v$session b where a.session_id = b.sid order by b.logon_time;

--查看连接的进程

SELECT sid, serial#, username, osuser FROM v$session;

--查出锁定表的sid, serial#,os_user_name, machine_name, terminal，锁的type,mode

SELECT s.sid, s.serial#, s.username, s.schemaname, s.osuser, s.process, s.machine,

s.terminal, s.logon_time, l.type

FROM v$session s, v$lock l

WHERE s.sid = l.sid

AND s.username IS NOT NULL

ORDER BY sid;

此时通过这些查询，我们已经能够定位是哪个进程导致了锁表的产生。同时获取到了进程的sid以及serial。

执行中断进程的sql，

alter system kill session'210,11562';

讲道理，此时已经进行了进程的结束，但是发现表还是在锁着的。于是可能是查看一下造成死锁的这一进程的状态。

select saddr, sid, serial#, paddr, username, status, machine from v$session where username is not null

通过status发现锁定的进程的状态已经改变为KILLED，这种状态可能导致长时间的未释放资源，PMON并没有对其进行清除，等了很久仍然是锁表状态。

于是可能需要操作系统级别的对进程进行清除。

我们查询出会话进程在操作系统中的进程id。

select a.spid,b.sid,b.serial#,b.username,b.status from v$process a,v$session b where a.addr=b.paddr ;

我们进入linux后台。通过kill -9 spid，此时执行后，发现表已经解锁了，死锁结束。呼~不容易。

接下来问题又来了，我们如何继续更新数据呢。最终决定实用存储过程来进行增加数据。

create or replace procedure aaa(startdate in date, days in number) as

--生成的数据包含startdate当天

i number;

begin

  i := 0;

  while i < days loop

      insert into aaa1

      select sec_pkid.nextval,startdate + i,

      '字段名'，'字段名'，'字段名'，'字段名'

      from aaa2 t where collect_time = to_date('2018-11-09','yyyy-mm-dd');

      i := i+1;

      commit;

  end loop;

end aaa;

oracle大数据量更新引发的死锁问题解决方法及oracle分区和存储过程的思考的更多相关文章

Oracle大数据量查询实际分析
Oracle数据库: 刚做一张5000万条数据的数据抽取,当前表同时还在继续insert操作,每分钟几百条数据. 该表按照时间,以月份为单位做的表分区,没有任何索引,当前共有14个字段,平均每个字段3 ...
mongo 大数据量更新注意事项
1.大数据量最好在本地执行更新. 2.在客户端执行更新时需要注意serve活动时间(10分钟),10分钟内解决不了的使用batchSize 或者db.getCollection("&quo ...
大数据量场景下storm自定义分组与Hbase预分区完美结合大幅度节省内存空间
前言:在系统中向hbase中插入数据时,常常通过设置region的预分区来防止大数据量插入的热点问题,提高数据插入的效率,同时可以减少当数据猛增时由于Region split带来的资源消耗.大量的预分 ...
大数据量高并发访问SQL优化方法
保证在实现功能的基础上,尽量减少对数据库的访问次数:通过搜索参数,尽量减少对表的访问行数,最小化结果集,从而减轻网络负担:能够分开的操作尽量分开处理,提高每次的响应速度:在数据窗口使用SQL时,尽量把 ...
mongo大数据量更新服务端超时解决： Cursor not found, cursor id: 82792803897
mongodb pymongo.errors.CursorNotFound: Cursor not found, cursor id: 82792803897 默认 mongo server维护连接的 ...
浅谈PageHelper插件分页实现原理及大数据量下SQL查询效率问题解决
前因:项目一直使用的是PageHelper实现分页功能,项目前期数据量较少一直没有什么问题.随着业务扩增,数据库扩增PageHelper出现了明显的性能问题.几十万甚至上百万的单表数据查询性能缓慢,需 ...
oracle大数据量。表分区提示查询效率
现在业务有一张usertrack 日志记录表.每天会产生30万条数据.数据量大查询效率会非常慢所以我考虑通过表分区来提示效率逻辑上是一张表.但是分区后会按照分区条件将数据分在不同的物理文件优点 ...
mysql大数据量下修改表结构的方法
http://www.blogjava.net/anchor110/articles/361152.html
Win环境下Oracle小数据量数据库的物理备份
Win环境下Oracle小数据量数据库的物理备份环境:Windows + Oracle 单实例数据量:小于20G 重点:需要规划好备份的路径,建议备份文件和数据库文件分别存在不同的存储上. 1.开 ...

随机推荐

后端不会写页面怎么办？推荐几个好用的前端UI模板、组件对比
前言下面推荐并对比几个好用的前端UI模板推荐给以下的人使用: 1.不想重复造轮子的后端 2.不想学bootstrap的后端 3.后端开发想自己写简单页面的 4.偷懒的前端本文注重手机端,对web ...
走进javascript——重拾数组
Array构造器如果参数只有一个并且是Number类型,那么就是指定数组的长度,但不能是NaN,如果是多个会被当做参数列表. new Array(12) // (12) [undefined × 1 ...
深度学习Trick——用权重约束减轻深层网络过拟合|附(Keras)实现代码
在深度学习中,批量归一化(batch normalization)以及对损失函数加一些正则项这两类方法,一般可以提升模型的性能.这两类方法基本上都属于权重约束,用于减少深度学习神经网络模型对训练数据的 ...
koa2入门使用总结
koa2的介绍 Koa 是一个新的 web 框架,由 Express 幕后的原班人马打造, 致力于成为 web 应用和 API 开发领域中的一个更小.更富有表现力.更健壮的基石. 通过利用 async ...
第三方工具系列--Lombok常用注解
原创作品,可以转载,但是请标注出处地址:https://www.cnblogs.com/V1haoge/p/9329798.html Lombok注解解析: @NonNull 使用在方法的参数或者构造 ...
#20 Python文件
前言前面几节枯燥的模块终于结束了,想要完全掌握前几节的模块需要不断的练习才行,毕竟眼过千遍不如手过一遍嘛.在一些项目需求里,要对文件进行IO操作,毕竟重要数据不可能打印到屏幕上而不去保存,Pytho ...
Docker介绍及常用操作演示（一）--技术流ken
Docker简介 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化.容器是完全使用沙箱机制,相互 ...
“每日一道面试题”.Net中GC的运行机制
GC 也就是垃圾回收,经常遇到的面试题,关于GC 感觉可以写一本书,我们要做的也就是简单理解,如果有意愿,可以深入研究所谓的垃圾回收,也就是清理回收托管堆上不再被使用的对象内存,并且移动仍在被使用的 ...
Java_Collections工具类
Collections 工具类 * Collection与Collections区别 Collection 接口,(大部分集合类的实现接口) Collections 工具类(针对列表) * Colle ...
SpringBoot快速开始Hello World
介绍 Spring Boot跟Spring MVC不太一样,Spring MVC建新项目的时候是要配置很多东西的,而Spring Boot讲究的是快速,提供了很多默认配置,所以新建一个项目不需要手动配 ...

oracle大数据量更新引发的死锁问题解决方法及oracle分区和存储过程的思考

前言

曲折的过程开始

oracle大数据量更新引发的死锁问题解决方法及oracle分区和存储过程的思考的更多相关文章

随机推荐

热门专题