原文:数据仓库之抽取数据:openrowset函数带bulk操作符的用法


在做数据仓库时,最重要的就是ETL的开发,而在ETL开发中的第一步,就是要从原OLTP系统中抽取数据到过渡区中,再对这个过渡区中的数据进行转换,最后把经过处理的干净的数据加载到数据仓库中。

目标数据库是sql server,通过openrowset函数带bulk操作符的用法,导入、导出、更新数据。

带bulk操作符的方式相对于其他方式来说,速度更快。

使用方法:

第1种用法:

openrowset

(

    bulk 要加载结果集的文件名,

         formatfile = 格式化文件名,

         bulk选项

)

第2种用法:

openrowset

(

    bulk 文件名,

         SINGLE_BLOB | SINGLE_CLOB | SINGLE_NCLOB

)

1、开启即席查询


  1. --修改高级参数
  2. sp_configure 'show advanced options',1
  3. go
  4. --允许即席分布式查询
  5. sp_configure 'Ad Hoc Distributed Queries',1
  6. go
  7. --如果配置的值不在合理范围(在最小值最大值范围内),那么可以强制覆盖
  8. reconfigure with override  
  9. go

2、第1种用法,把bcp导出的数据,导入数据库中

具体导入数据时,可以先用bcp把表的格式文件倒出来,然后在把数据导进去,这样按照格式自动转化。


  1. select *
  2. from
  3. openrowset(bulk 'c:\calendar.txt', --要读取的文件路径和名称
  4. formatfile='c:\calendar.fmt', --格式化文件的路径和名称
  5. firstrow = 1, --要载入的第一行
  6. --lastrow = 1000, --要载入的最后一行,此值必须大于firstrow
  7. maxerrors = 10, --在加载失败之前加载操作中最大的错误数
  8. errorfile ='c:\calendar_error.txt', --存放错误的文件
  9. rows_per_batch = 100 --每个批处理导入的行数
  10. ) as calendar

3、第2种用法


  1. select 1,
  2. BulkColumn --这个是从数据源获取的,要插入的列,默认的列名
  3. from openrowset(
  4. BULK 'c:\helloworld.class',--指定文件路劲,这里是本地路径
  5. SINGLE_BLOB --指定二进制数据是SINGLE_BLOB
  6. --指定文本是SINGLE_CLOB、SINGLE_NCLOB
  7. )X --必须要别名
  8. select 1,
  9. binColumn --引用后面定义的列别名
  10. from openrowset(
  11. BULK 'c:\Katongxiar01.jpg', --指定文件路劲,这里是本地路径
  12. SINGLE_BLOB --指定二进制数据是SINGLE_BLOB
  13. --指定文本是SINGLE_CLOB、SINGLE_NCLOB
  14. )X(binColumn) --这里还定义了列的别名

把bmp文件直接更新到字段pic中,直接从txt文件查询数据作为1列显示:


  1. update t
  2. set pic = (
  3. select BulkColumn
  4. from openrowset(bulk 'c:\dwhj.bmp',
  5. SINGLE_BLOB) AS X --一定不要忘了定义别名
  6. select 1,
  7. binColumn --引用后面定义的列别名
  8. from openrowset(
  9. BULK 'c:\calendar.txt', --指定文件路劲,这里是本地路径
  10. SINGLE_CLOB --指定二进制数据是SINGLE_BLOB
  11. --指定文本是SINGLE_CLOB、SINGLE_NCLOB
  12. )X(binColumn) --这里还定义了列的别名
发布了416 篇原创文章 · 获赞 135 · 访问量 94万+

数据仓库之抽取数据:openrowset函数带bulk操作符的用法的更多相关文章

  1. 数据仓库之抽取数据:通过openrowset执行存储过程

    原文:数据仓库之抽取数据:通过openrowset执行存储过程 在做数据仓库时,最重要的就是ETL的开发,而在ETL开发中的第一步,就是要从原OLTP系统中抽取数据到过渡区中,再对这个过渡区中的数据进 ...

  2. 数据仓库之抽取数据:通过bcp命令行导入数据

    原文:数据仓库之抽取数据:通过bcp命令行导入数据 在做数据仓库时,最重要的就是ETL的开发,而在ETL开发中的第一步,就是要从原OLTP系统中抽取数据到过渡区中,再对这个过渡区中的数据进行转换,最后 ...

  3. MySQL数据类型转换函数CAST与CONVERT的用法

    MySQL 的CAST()和CONVERT()函数可用来获取一个类型的值,并产生另一个类型的值.两者具体的语法如下: 1.CAST(value as type) 就是CAST(xxx AS 类型) 2 ...

  4. SQL Server 随机数,随机区间,随机抽取数据rand(),floor(),ceiling(),round(),newid()函数等

    在查询分析器中执行:select rand(),可以看到结果会是类似于这样的随机小数:0.36361513486289558,像这样的小数在实际应用中用得不多,一般要取随机数都会取随机整数.那就看下面 ...

  5. Atitit.并发测试解决方案(2) -----获取随机数据库记录 随机抽取数据 随机排序 原理and实现

    Atitit.并发测试解决方案(2) -----获取随机数据库记录 随机抽取数据 随机排序 1. 应用场景 1 2. 随机抽取数据原理 1 3. 常用的实现方法:::数据库随机函数 1 4. Mssq ...

  6. Oracle 10g使用amdu抽取数据文件

    环境:OEL 5.7 + Oracle 10.2.0.5 RAC 需求:实验在Oracle 10g环境使用amdu抽取数据库文件 本文主要目的是介绍3个知识点: 1.使amdu可以在oracle 10 ...

  7. 孤荷凌寒自学python第四十八天通用同一数据库中复制数据表函数最终完成

    孤荷凌寒自学python第四十八天通用同一数据库中复制数据表函数最终完成 (完整学习过程屏幕记录视频地址在文末) 今天继续建构自感觉用起来顺手些的自定义模块和类的代码. 今天经过反复折腾,最终基本上算 ...

  8. 孤荷凌寒自学python第四十七天通用跨数据库同一数据库中复制数据表函数

    孤荷凌寒自学python第四十七天通用跨数据库同一数据库中复制数据表函数 (完整学习过程屏幕记录视频地址在文末) 今天继续建构自感觉用起来顺手些的自定义模块和类的代码. 今天打算完成的是通用的(至少目 ...

  9. 用openrowset函数操作远程数据库

    OPENROWSET 包含访问 OLE DB 数据源中的远程数据所需的全部连接信息.当访问链接服务器中的表时,这种方法是一种替代方法,并且是一种使用 OLE DB 连接并访问远程数据的一次性的.特殊的 ...

随机推荐

  1. cross socket和msgpack的数据序列和还原

    cross socket和msgpack的数据序列和还原 procedure TForm1.Button1Click(Sender: TObject); begin var pack: TSimple ...

  2. Mysql -- BLOB, TEXT, GEOMETRY or JSON column 'result' can't have a default value

    执行上面的代码, 即可解决, 不过mysql重启之后还会有问题. 根本解决: 将mysql的配置文件中的sql_mode项 注释掉.

  3. grub下如何指定哪个分区为根文件系统?

    答: 使用root命令,如: grub> set root=(hd0,msdos1)

  4. SQL-W3School-总结:SQL 总结

    ylbtech-SQL-W3School-总结:SQL 总结 1.返回顶部 1. SQL 概要 本教程已经向您讲解了用来访问和处理数据库系统的标准计算机语言. 我们已经学习了如何使用 SQL 在数据库 ...

  5. Tomcat重启Shell脚本

    --测试通过 vim restart_tomcat.sh#!/bin/bash# Filename: restart_tomcat.sh# Description: Restart tomcat# D ...

  6. 002-创建型-05-原型模式(Protype)

    一.概述 指原型实例指定创建对象的种类,并通过克隆这些原型创建新的对象 原型模式就是让类实现Cloneable接口,达到克隆原型类的方式. 1.1.适用场景 1.在创建对象的时候,我们不只是希望被创建 ...

  7. Vue.js学习之简介(待续)

    Vue.js 渐进式JavaScript 框架 易用:已经会了 HTML.CSS.JavaScript?即刻阅读指南开始构建应用! 灵活:不断繁荣的生态系统,可以在一个库和一套完整框架之间自如伸缩. ...

  8. 查看linux是几位操作系统

    查看linux是几位操作系统 摘自:https://blog.csdn.net/a34569345/article/details/80179927 2018年05月03日 14:44:44 bill ...

  9. Linux -- Reactor

    结构 1. handles 资源的标志.这些资源通常包含网络连接,文件,定时器,同步对象等.handles 被用在注册服务器来标记socket,以便同步事件复用(Synchronous Event D ...

  10. 《海会圣贤》高清字幕版(由香港佛陀教育协会发布DVD恭敬转成)

    常念阿彌陀佛 2015-09-22 视频(建议WIFI下收看)时长72分钟 https://v.qq.com/x/page/f0166amk57h.html 香港佛陀教育协会发布DVD   DVD+高 ...