oracle存储海量数据设计方案

日历基本活动表的数据有四千万条，在这些生产库业务中是小的了。

从三个方面提高效率；

1.sql语句

要绑定变量，sql语句书写规范这些，包括的就多了。主要目的就是提高数据库吞吐量及业务SQL响应时间。

2.表设计

是否按范式设计，是否违反范式设计采用容易，减少查询语句的表关联等

3.从db角度是执行计划

保证正确的SQL执行计划

------------------------------------------下面我们详细分析--------------------------------------------

sql语句方面：

1.SQL优化的原则是：将一次操作需要读取的BLOCK数减到最低,即在最短的时间达到最大的数据吞吐量。 
调整不良SQL通常可以从以下几点切入： 
检查不良的SQL，考虑其写法是否还有可优化内容 
检查子查询 考虑SQL子查询是否可以用简单连接的方式进行重新书写 
检查优化索引的使用 
考虑数据库的优化器

2. 避免出现SELECT * FROM table 语句，要明确查出的字段。 
3. 在一个SQL语句中，如果一个where条件过滤的数据库记录越多，定位越准确，则该where条件越应该前移。 
4. 查询时尽可能使用索引覆盖。即对SELECT的字段建立复合索引，这样查询时只进行索引扫描，不读取数据块。 
5. 在判断有无符合条件的记录时建议不要用SELECT COUNT （*）和select top 1 语句。 
6. 使用内层限定原则，在拼写SQL语句时，将查询条件分解、分类，并尽量在SQL语句的最里层进行限定，以减少数据的处理量。 
7. 应绝对避免在order by子句中使用表达式。 
8. 如果需要从关联表读数据，关联的表一般不要超过7个。 
9. 小心使用 IN 和 OR，需要注意In集合中的数据量。建议集合中的数据不超过200个。 
10. <> 用 < 、 > 代替，>用>=代替，<用<=代替，这样可以有效的利用索引。 
11. 在查询时尽量减少对多余数据的读取包括多余的列与多余的行。 
12. 对于复合索引要注意，例如在建立复合索引时列的顺序是F1，F2，F3，则在where或order by子句中这些字段出现的顺序要与建立索引时的字段顺序一致，且必须包含第一列。只能是F1或F1，F2或F1，F2，F3。否则不会用到该索引。 
13. 多表关联查询时，写法必须遵循以下原则，这样做有利于建立索引，提高查询效率。格式如下select sum（table1.je） from table1 table1, table2 table2, table3 table3 where (table1的等值条件（=）) and (table1的非等值条件) and (table2与table1的关联条件) and (table2的等值条件) and (table2的非等值条件) and (table3与table2的关联条件) and (table3的等值条件) and (table3的非等值条件)。 
注:关于多表查询时from 后面表的出现顺序对效率的影响还有待研究。 
14. 子查询问题。对于能用连接方式或者视图方式实现的功能，不要用子查询。例如：select name from customer where customer_id in ( select customer_id from order where money>1000)。应该用如下语句代替：select name from customer inner join order on customer.customer_id=order.customer_id where order.money>100。 
15. 在WHERE 子句中，避免对列的四则运算，特别是where 条件的左边，严禁使用运算与函数对列进行处理。比如有些地方 substring 可以用like代替。 
16. 如果在语句中有not in（in）操作，应考虑用not exists（exists）来重写,最好的办法是使用外连接实现。 
17. 对一个业务过程的处理，应该使事物的开始与结束之间的时间间隔越短越好，原则上做到数据库的读操作在前面完成，数据库写操作在后面完成，避免交叉。 
18. 请小心不要对过多的列使用列函数和order by,group by等，谨慎使用disti软件开发t。 
19. 用union all 代替 union，数据库执行union操作，首先先分别执行union两端的查询，将其放在临时表中，然后在对其进行排序，过滤重复的记录。 
当已知的业务逻辑决定query A和query B中不会有重复记录时，应该用union all代替union，以提高查询效率。
数据更新的效率 
1. 在一个事物中，对同一个表的多个insert语句应该集中在一起执行。 
2. 在一个业务过程中，尽量的使insert,update,delete语句在业务结束前执行，以减少死锁的可能性。 

表设计

为了避免I/O的冲突，我们在设计数据库物理规划时应该遵循几条基本的原则(以ORACLE举例)： 
1.table和index分离：table和index应该分别放在不同的tablespace中。 
2.Rollback Segment的分离：Rollback Segment应该放在独立的Tablespace中。 
3.System Tablespace的分离：System Tablespace中不允许放置任何用户的object。（mssql中primary filegroup中不允许放置任何用户的object） 
4.Temp Tablesace的分离：建立单独的Temp Tablespace，并为每个user指定default Temp Tablespace 
5.避免碎片：但segment中出现大量的碎片时，会导致读数据时需要访问的block数量的增加。对经常发生DML操作的segemeng来说，碎片是不能完全避免的。所以，我们应该将经常做DML操作的表和很少发生变化的表分离在不同的Tablespace中。 
当我们遵循了以上原则后，仍然发现有I/O冲突存在，我们可以用数据分离的方法来解决。 
6.连接Table的分离：在实际应用中经常做连接查询的Table，可以将其分离在不同的Taclespace中，以减少I/O冲突。 
7.使用分区：对数据量很大的Table和Index使用分区，放在不同的Tablespace中。 
在实际的物理存储中，建议使用RAID。日志文件应放在单独的磁盘中。

执行计划

有单独文章介绍，详细见http://www.cnblogs.com/wanghongye/p/5047422.html

---------------------------------------------数据库的分区---------------------------------------------

彩信数据库使用的是范围hash分区。对datenum这个字段进行ora_hash,把数据放到不同的分区中，建立起datenum和分区的对应关系。

注：ORA_HASH(expr,max_bucket,seed_value)计算字符串的hash值

 --查询mms_collect_frame的datenum的分区情况

 select DATENUM,ora_hash(DATENUM,15,0) from mms_collect_frame order by datenum;

 --查询P_201601分区中的数据

 select * from mms_collect_frame partition(P_201601);

采用他们分解成较小和易于管理的称为分区的片(piece)的方法。一旦分区被定义，SQL语句就可以访问的操作某一个分区而不是整个表，因而提高管理的效率。分区对于数据仓库应用程序非常有效，因为他们常常存储和分析巨量的历史数据。

如何对数据进行分区，分区表的分类

Range partitioning（范围分区）
Hash partitioning（哈希分区）
List partitioning（列表分区）
Composite range-hash partitioning（范围-哈希组合分区）
Composite range-list partitioning（范围-列表组合分区）

---------------------------------------------索引为什么不是越多越好-----------------------------------

索引和tabel分开管理，单独维护需要代价

在DML中，使用索引select可能比较高，但是insert等效率会变低

索引过多执行计划变低

参考：http://www.imooc.com/article/1204

oracle存储海量数据设计方案的更多相关文章

oracle存储参数（storage子句）含义及设置技巧
可用于:表空间.回滚段.表.索引.分区.快照.快照日志参数名称缺省值最小值最大值说明 INITIAL 5(数据块) 2(数据块) 操作系统限定分配给Segment的第一个Extent的大小 ...
oracle存储大文本clob、blob
oracle存储大文本clob.blob 1 package cn.itcast.web.oracle.util; 2 3 import java.sql.Connection; 4 import j ...
php调用oracle存储
//todo 调用oracle 存储$config = //数据库配置文件里面包含用户密码和host和端口以及dbname $conn = oci_connect($config['usernam ...
Oracle存储——逻辑结构
Oracle 数存储——物理结构 Oracle存储结构:物理结构+逻辑结构 Oracle 数据库存储逻辑结构 Oracle Schema Objects(Schema Object Storage A ...
Oracle存储函数，存储过程
一.Oracle存储函数:存储的PL/SQL语法块,完成特定的功能.1.语法: 函数关键字: function (1)创建函数 CREATE [OR REPLACE] FUNCTION <fun ...
ibatis.net调用oracle存储过返回游标SYS_REFCURSOR结果集
最近在用ibatis.net框架和oracle 11g开发一套程序.其中有一个需求就是通过存储过程,查询指定条件的数据集. 但是在开发的过程中遇到了问题,问题如下: 1.如何通过ibatis.net执 ...
Java调用Oracle存储Package
Oracle的包Package中可以有很多存储,可通过该包的总调入口在java中直接调用. //java调用oracle的package代码 public boolean cal() throws j ...
ORACLE 存储函数
前奏: 必要的概念: ORACLE 提供能够把 PL/SQL 程序存储在数据库中.并能够在不论什么地方来运行它.这样就叫存储过程或函数. 过程和函数统称为 PL/SQL 子程序.他们是被命名的 PL ...
Oracle 存储结构三
Oracle数据库服务器自动管理空间的方法段空间的分配空间以区间的形式分配给段,区间是一组连续的Oracle块.每个数据文件都有一个位图,来描述文件中块的状态,块可能是空闲的,也可能是区间中已分配 ...

随机推荐

mongoose学习笔记1--基础知识1
今天我们将学习Mongoose,什么是Mongoose呢,它于MongoDB又是什么关系呢,它可以用来做什么呢? MongoDB是一个开源的NoSQL数据库,相比MySQL那样的关系型数据库,它更显得 ...
win7画板橡皮擦改变大小
按住CTRL键不放,再按小键盘上的“+”号键,可以将橡皮擦放大
INNODB
INNODB,是Mysql5.7的默认存储引擎,是事务安全的,支持ACID,具有提交,回滚和crash-recovery[灾备]能力,以保护用户数据. 优势:一旦Server崩溃,Innodb会自动保 ...
http://poj.org/problem?id=3278(bfs)
Catch That Cow Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 76935 Accepted: 24323 ...
Linux系统下设置Tomcat自启动
需要将tomcat加入自启动队列中,则需要进行如下的操作: 以root用户登录系统: cd /etc/rc.d/init.d/ vi tomcat 文件内容参考如下: #!/bin/sh # # to ...
KMP算法学习
kmp算法完成的任务是:给定两个字符串O和f,长度分别为n和m,判断f是否在O中出现,如果出现则返回出现的位置.常规方法是遍历a的每一个位置,然后从该位置开始和b进行匹配,但是这种方法的复杂度是O(n ...
JavaScript基础——使用JavaScript对象
JavaScript有许多内置对象,如Number(数字).Array(数组).String(字符串).Date(日期)和Math(数学).这些内置对象都有成员属性和方法.除了JavaScript对象 ...
Python lambda函数使用
设计模式学习之组合模式（Composite，结构型模式）（10）
转载地址:http://www.cnblogs.com/zhili/p/CompositePattern.html 一.引言在软件开发过程中,我们经常会遇到处理简单对象和复合对象的情况,例如对操作系 ...
Elasticsearch在Windows下的安装
下载Elasticsearch,地址:elasticsearch.org/download 下载jdk,百度搜索jdk下载即可配置JAVA_HOME变量,配置方法在此文:http://jingyan ...

oracle存储海量数据 设计方案

oracle存储海量数据 设计方案的更多相关文章

随机推荐

热门专题

oracle存储海量数据设计方案

oracle存储海量数据设计方案的更多相关文章