项目中使用到SSIS访问vertica,以下是我使用中总结的一些注意事项:

1.vertica对约束的处理方式与之前的DBMS是不同的。

以上的截图说明,在使用ado.net provider连接vertica进行数据加载的时候,ssis 返回的信息是不准确的。这不是provider的问题,使用odbc时也遇到过类似的问题。

a.在SSIS中图显示全部绿色,表示执行成功,但是到vertica中查询,却没有发现一条记录。

后仔细检查发现,source中的数据违反了vertica中的一个not null 约束,数据没有进去,但是没有报错误提示。 Ssis path中显示343条记录,但是实际上只有341条记录,也有两条记录违反约束。

但是没有错误提示。

b.给表添加了unique(primary)约束,但是数据仍然可以是重复的。vertica官方文档说是vertica这样做加快了处理速度,减少了检查约束造成的性能损失,有利于大量数据加载。

你可以使用ANALYZE_CONSTRAINTS('shcema.tablename')来检查表中的违约情况。

那是不是就需要你保证数据在进入之前是符合条件的?还是需要怎么处理?

2.vertica is case sensitive when compare row content.

Select table_name from tables where table_name='abc' or table_name='Abc'

是不同的

3.vertica中的merge有些限制与mssqlserver是不同的,它不允许使用subquery,也不允许对表中有identity或bind senquence的column存在的时候进行merge.

You should find some workaround to do this when you need merge to load data.

a.not need subquery, you can use temp table.

b.not used identity column, you can remove them , or unbind the column and sequence.

You should know that , when you create a identity column, in fact, vertica create a sequence and bind this to your column.

4.jdbc ,ado.net provider中处理的数据精度和vsql client tool是不一样的,timestamp类型默认可以接受6位以内的微秒精度。但是在jdbc 或 ado.net provider 作为连接的工具中查询时,你是无法看到这些秒后面的小数值的,如果你使用这种字段作为增量加载的依据,你会发现有一定的误差。

我暂时的处理方案是让它转成varchar类型后接收,这样不会丢失精度。

5.vertica支持到sql92标准,很多sql statement 的写法是与sqlserver的Tsql是不同的,以下是我发现的一些常见的不同之处,很多是因为那是TSQL中的实现,不是标准的sql.

 a.top n in tsql, you should change to limit n when you want to restrict the record counts.

 b.you can not delete records in CTE. This is also tsql's specification. 

 c.update and delete statement different with tsql. 

 tsql: 

 delete from a 

 from mytablea as a 

 join mytableb as b 

 on a.column1=b.column1 

 and a.column2=b.column2 

 and …. 

vsql: 

 delete from mytablea 

 where exists 

 (select null from mytableb as b where mytablea.column1=b.column1 

 and a.column2=b.column2 

 ) 

tsql: 

 update a 

 set a.c3=b.c3 

 ,a.c4=b.c4 

 from mytablea as a 

 join mytableb as b 

 on a .c1=b.c1 and a.c2=b.c2 

Vsql: 

Update mytablea 

Set mytablea.c3=b.c3 

,mytablea.c4=b.c4 

From mytableb as b 

Where mytablea.c1=b.c2 

And mytablea.c2=b.c2 

6.vertica中没有bit类型,可以使用布尔替换,它创建索引的时候不能指定desc或asc,它默认是创建为升序的。Identity column不用指定数据类型, 现在会默认为bigint。

Create table mytable(rowid identity(1,1),rowname varchar(10))

SSIS WITH VERTICA的注意事项总结的更多相关文章

  1. SSIS with vertica

    使用ODBC进行连接,因为SSIS中没有直接的ODBC connection,所以使用ADO.NET的连接器. 九分钟才跑了四百来条数据. 这个图反应了SSIS的数据流速度还是可以的,但是瓶颈就在OD ...

  2. 内存中 OLTP - 常见的工作负荷模式和迁移注意事项(二)

    ----------------------------我是分割线------------------------------- 本文翻译自微软白皮书<In-Memory OLTP – Comm ...

  3. 第二篇 Integration Services:SSIS数据泵

    本篇文章是Integration Services系列的第二篇,详细内容请参考原文. 简介SSIS用于移动数据.数据流任务提供此功能.因为这个原因,当介绍SSIS时我喜欢从数据流任务开始.数据流任务的 ...

  4. SSIS 学习(8):事务【转】

    事务,在数据库开发与应用中,发挥了重要的作用,但在Integration Services 包开发过程中,我们还一直没有提到过这个概念,它是不是还是如此,能让各数据库兄弟和睦相处,团结一致,同进退.共 ...

  5. 在SSIS包中使用 Checkpoint从失败处重新启动包

    使用SSIS做ETL的过程中会遇到各种各样的错误,对于一些大数据量的Job失败以后我们不希望重新运行,因为重新运行的时间开销是非常大的,我们只希望从失败的部分开始运行,这样可以省去很多的时间. SSI ...

  6. 微软BI 之SSIS 系列 - 通过 OLE DB 连接访问 Excel 2013 以及对不同 Sheet 页的数据处理

    文章更新历史 2014年9月7日 - 加入了部分更新内容,在文章最后提到了关于不同 Office Excel 版本间的连接问题. 开篇介绍 这篇文章主要总结在 SSIS 中访问和处理 Excel 数据 ...

  7. SSIS 遍历目录,把文件内容导入数据库

    最近接手一个项目,程序的基本框架是:程序A导出数据,以.tsv格式存储,数据列之间以tab间隔:程序B吃文档,把数据导入到数据库中,并把处理过的文档备份/移动到指定的目录中.为了快速开发,程序B设计成 ...

  8. 【译】第二篇 Integration Services:SSIS数据泵

    本篇文章是Integration Services系列的第二篇,详细内容请参考原文. 简介SSIS用于移动数据.数据流任务提供此功能.因为这个原因,当介绍SSIS时我喜欢从数据流任务开始.数据流任务的 ...

  9. HP Vertica Analytics Platform 评測

    1.vertica概念 面向数据分析的数据仓库系统解决方式 2.vertica关键特性 Ø  标准的SQL接口:能够利用已有的BI.ETL.Hadoop/MapReduce和OLTP环境 Ø  高可用 ...

随机推荐

  1. 学习笔记(一)——MVC扩展

    1.视图引擎的作用,总结为两点: 查找视图 渲染视图 ViewEngine即视图引擎, 在ASP.NET MVC中将ViewEngine的作用抽象成了 IViewEngine 接口. 默认情况下,AS ...

  2. 【Unity】13.2 通过Lighting Window设置相关参数

    分类:Unity.C#.VS2015 创建日期:2016-05-19 一.简介 Unity 5.3.4的Lighting Window有3个选项卡:Object.Scene.Lightmaps. 二. ...

  3. struts2进阶篇(4)

    一.使用ActionContext访问Servlet API strtus2提供了一个ActionContext类,该类别称为Action上下文或者Action环境,Action可以通过该类来访问最常 ...

  4. FlexPaper 2.2.1介绍与提取嵌入的文档

            源起看到某个公司内网的公文使用FlexPaper组件来显示文档,在这儿是GoogleCode Project的主页, 还有现在的官方主页.目前FlexPaper是个开源项目,GPLv3 ...

  5. Python数学运算的一个小算法(求一元二次方程的实根)

    请定义一个函数quadratic(a, b, c),接收3个参数,返回一元二次方程:ax² + bx + c = 0的两个解. #!/usr/bin/env python # -*- coding: ...

  6. HTML · 图片热点,网页划区,拼接,表单

    图片热点: 规划出图片上的一个区域,可以做出超链接,直接点击图片区域就可以完成跳转的效果. 网页划区: 在一个网页里,规划出一个区域用来展示另一个网页的内容. 网页的拼接: 在一个网络页面内,规划出多 ...

  7. [CLK Framework] CLK.Threading.PortableTimer - 跨平台的Timer类别

    [CLK Framework] CLK.Threading.PortableTimer - 跨平台的Timer类别 问题情景 开发应用程式的时候,免不了需要加入一些定时执行的设计,例如说:定时更新画面 ...

  8. c# Sqlite帮助类

    最近有WPF做客户端,需要离线操作存储数据,在项目中考虑使用Sqlite嵌入式数据库,在网上找了不少资料,最终整理出一个公共的帮助类. Sqlite是一个非常小巧的数据库,基本上具备关系型数据库操作的 ...

  9. 拖拽改变div的大小

    拖拽改变div的大小 <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type&qu ...

  10. AloneJs.confirmbox() —— 确认框

    一.引用 <link href="https://cdn.suziyun.com/alonejs.min.css" rel="stylesheet" /& ...