一、 数据库

1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?materialized view

答:a:视图是虚拟表,提高了表的安全性,视图没有实际物理空间,而表有实际存储的物理空间

b:物化视图存储了实实在在的数据,而普通视图之存储了定义

c:物化视图的优点像索引一样,提高查询性能。当基表发生变化时,物化视图也应当刷新。

物化视图是数据库中的一种存储数据的对象,和表一样,存储了数据。用于预先计算并保存表连接或者聚集等耗时较多的操作。这样,在执行查询的时候,就可以避开连接、聚集等耗时的操作,从而快速的得到结果。它可以查询表,视图甚至是其他物化视图中的数据。和视图不同的是,它存储了实实在在的数据,而视图只是存储了定义而已,所以,也是可以在物化视图上创建索引的。物化视图在很多方面,和索引很相似:使用它的主要目的是为了提高查询性能;物化视图对应用是透明的,增加或者删除物化视图不会影响应用程序中查询语句的正确性和有效性;物化视图会占用存储空间;当基表发生变化时,物化视图也应当刷新。通常情况下,物化视图被称为主表(在复制期间)或者明细表(在数据仓库中)。

2、 Oracle数据库,有哪几类索引,分别有什么特点?

答:三类索引

a:B树索引

b:文本索引

c:位图索引

3、 Union与Union All的区别?

Union 会去掉重复,效率比 union all 低

4、 对游标的理解?游标的分类?使用方法?

显示游标:自己打开关闭

隐式游标:自动打开关闭

5、 如何查找和删除表中的重复数据?给出方法或SQL。

查找表中重复数据

select ID1,email from email e1
where rowid  < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

删除表中重复数据
 delete ID1,email from email e1
 where rowid  < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

select ID1,email from email e1
 where rowid  > (select min(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

6、 不借助第三方工具,怎么查看SQL的执行计划?

Set autotrace on EXPLAIN PLAN FOR

7、 创建索引有哪些需要注意的要点?

根据每个索引的特点说出建立时应注意的问题。

8、 Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?

范围分区:根据某个值的范围

Hash分区:散列分区,是数据均匀分布

复合分区:先范围分区再Hash分区

增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

均衡I/O:能把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;

改善查询性能:对分区对象的查询能仅搜索自己关心的分区,提高检索速度。

9、 表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。

select * from email where rownum <=30 
     minus
     select * from email where rownum <=20

order by 2  //代表第二列

10、  备份如何分类?归档是什么含义?

逻辑备份:exp/imp
  物理备份:
  RMAN备份
  full backup/incremental backup(累积/差异)
  热备份:alter tablespace begin/end backup;
  冷备份:脱机备份(database shutdown)

关于归档日志:Oracle要将填满的在线日志文件组归档时,则要建立归档日志(archived redo log)。
  其对数据库备份和恢复有下列用处:
  数据库后备以及在线和归档日志文件,在操作系统和磁盘故障中可保证全部提交的事物可被恢复。
  在数据库打开和正常系统使用下,如果归档日志是永久保存,在线后备可以进行和使用。

  数据库可运行在两种不同方式下:
  NOARCHIVELOG方式或ARCHIVELOG 方式数据库在NOARCHIVELOG方式下使用时,不能进行在线日志的归档,如果数据库在ARCHIVELOG方式下运行,可实施在线日志的归档。

11、 如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?

nologging方式create,否则产生大量的redo。
根据当前的数据库及系统压力情况,进行适当并行创建。
加大sort_area_size

二、 ETL工具

1、 Informatica中,Update组件叫什么?更新机制?

2、 Informatica中,LookUp组件有哪几类?区别是什么?

3、 Informatica中,如何调用存储过程?

4、 Informatica中,工作流控制有哪些组件?

5、 Informatica优化方案?

6、 DataStage的JOB有哪些类型?特点分别是什么?

7、 DataStage中,如何设置parallel job并行运行?

8、 DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?

9、 DataStage的优化方案?

三、 模型设计

http://wenku.baidu.com/view/01ace46427d3240c8447efdf.html

1、 有哪几种模型设计方法?特点分别是什么?

2、 模型设计的步骤?

3、 维度模型的设计方法?

4、 模型设计的思路?业务需求驱动?数据驱动?

3、模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?

四、 Cognos开发

1、 Cube刷新方案?

2、 报表数据权限控制方案?

3、 Cube增量刷新方案?

五、 Shell开发

1、 在Unix/Linux中,查看磁盘空间可以用哪些命令?

df -hl

2、 在Unix/Linux中,压缩和解压缩文件可以用哪些命令?

tar zxvf 解压

tar czvf 压缩

3、 sed命令的作用?

对文本进行操作,一次处理一行

http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html

4、 在Unix/Linux中,添加用户用什么命令?

add user

5、 在Unix/Linux中,查看文件行数什么命令?

wc -lcw file1

l:行数

w:字数

c:字节数

六、 数据仓库设计

1、 增量数据获取方案?

2、 请解释以下概念:数据集市、事实表、维度表、OLAP

http://blog.sina.com.cn/s/blog_68ff317d0100zafa.html

3、 元数据管理在数据仓库中的运用有何心得?

4、 数据仓库系统的数据质量如何保证?方案?

5、 数据仓库系统组件接口设计方案?

七、 项目管理

八、 其他

1、 能否出差?

2、 期望薪资待遇多少?

3、 个人发展方向?

数据仓库与BI面试常见题目的更多相关文章

  1. java异常面试常见题目

    在Java核心知识的面试中,你总能碰到关于 处理Exception和Error的面试题.Exception处理是Java应用开发中一个非常重要的方面,也是编写强健而稳定的Java程序的关键,这自然使它 ...

  2. java面试常见题目

    JAVA相关基础知识面向对象的特征有哪些方面 1.抽象:抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面.抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用 ...

  3. C#面试常见题目

    1.CTS.CLS.CLR分别作何解释 CTS:Common Type System 通用系统类型.Int32.Int16→int.String→string.Boolean→bool CLS:Com ...

  4. mysql面试常见题目2

    Sutdent表的定义 字段名 字段描述 数据类型 主键 外键 非空 唯一 自增 Id 学号 INT(10) 是 否 是 是 是 sName 姓名 VARCHAR(20) 否 否 是 否 否 Sex ...

  5. JavaScript求数组Array的并集(javascript面试常见题目)

    var Utils = { joinArray:function(source,target){ for(var i = 0;i<source.length;i++){ var oa = sou ...

  6. mysql面试常见题目

    第一题 某班学生和考试成绩信息如下表Student所示: Student表 ID SName Mark 1 Jack 90 2 Marry 96 3 Rose 88 4 Bob 86 5 John 8 ...

  7. mysql面试常见题目3

    三十六大 冯唐 春水初生, 春林初盛, 春风十里,不如你. 秋风落叶, 秋雨绵绵, 愁心上秋,只为你. 某个员工信息表结构和数据如下: id name dept salary edlevel hire ...

  8. Net基础篇_学习笔记_第九天_数组_冒泡排序(面试常见题目)

    冒泡排序: 将一个数组中的元素按照从大到小或从小到大的顺序进行排列. for循环的嵌套---专项课题 int[] nums={9,8,7,6,5,4,3,2,1,0}; 0 1 2 3 4 5 6 7 ...

  9. Android常见面试笔试题目

    Android常见面试笔试题目 1.在多线程编程这块,我们经常要使用Handler,Thread和Runnable这三个类,那么他们之间的关系你是否弄清楚了呢? 答:可以处理消息循环的线程,他是一个拥 ...

随机推荐

  1. jenkins+gitlab钩子+shell脚本基于git的tag实现App增量更新

    转自:http://blog.csdn.net/kingboyworld/article/details/54175330 环境安装 jdk1.8 1.安装jenkins 首先到https://jen ...

  2. conn

    <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...

  3. mybatis常用标签

    1. 定义sql语句 1.1 select 标签 属性介绍: id :唯一的标识符. parameterType:传给此语句的参数的全路径名或别名 例:com.test.poso.User或user ...

  4. RDS for MySQL 如何使用 Percona Toolkit

    Percona Toolkit 包含多种用于 MySQL 数据库管理的工具. 下面介绍常用的 pt-online-schema-change  和  pt-archiver 搭配 RDS MySQL ...

  5. iOS开发-多线程开发之线程安全篇

    前言:一块资源可能会被多个线程共享,也就是多个线程可能会访问同一块资源,比如多个线程访问同一个对象.同一个变量.同一个文件和同一个方法等.因此当多个线程访问同一块资源时,很容易会发生数据错误及数据不安 ...

  6. 【LeetCode】97. Interleaving String

    Interleaving String Given s1, s2, s3, find whether s3 is formed by the interleaving of s1 and s2. Fo ...

  7. MySQL学习总结(二)数据库以及表的基本操作

    上一节中详细的介绍了关于MySQL数据库的安装过程,接下来我们就该对数据库以及表进行一些基本的操作了. 1.数据类型 MySQL数据库中提供了整数类型.浮点数类型.定点数类型.日期和时间类型.字符串类 ...

  8. ZOJ 3427 Array Slicing (scanf使用)

    题意  Watashi发明了一种蛋疼(eggache) 语言  你要为这个语言实现一个 array slicing 函数  这个函数的功能是 有一个数组初始为空  每次给你一个区间[ l, r)  和 ...

  9. 用bcdedit.exe重建bcd

    使用下面方法之前需要bcdedit.exe和bootsect.exe两个文件,bootsect.exe文件在vista和windows 7的安装光盘的boot目录下,而bcdedit.exe文件可以在 ...

  10. web.xml文件书写规则

    在为class文件写xml配置文件的书写规则,需要书写的东西如下 <servlet> <servlet-name></servlet-name> <servl ...