阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。

摘要:欢迎来到云数据迁移CDM的世界,跟着云小课一起学习云数据迁移。本课主要介绍云数据迁移的基本概念、功能、应用场景及使用过程,帮助您更好的了解云数据迁移。

本文分享自华为云社区《【云小课】EI第35课 云小课带你快速掌握云数据迁移CDM》,原文作者:阅识风云

云数据迁移是什么?

云数据迁移(Cloud Data Migration,简称CDM)是一种高效、易用的批量数据迁移服务,提供同构/异构数据源之间批量数据迁移服务,帮助客户实现数据自由流动。支持客户自建和公有云上的文件系统,关系数据库,数据仓库,NoSQL,大数据云服务,对象存储等数据源。

CDM同时也可以作为数据湖治理中心(Data Lake Governance Center,简称DGC)服务的一个组件,在产品能力上和独立形态保持一致,为DGC提供了简单易用的迁移能力和多种数据源到数据湖的集成能力,降低了客户数据源迁移和集成的复杂性,有效的提高您数据迁移和集成的效率。

产品功能

  • 表/文件迁移:实现在同构、异构数据源之间进行表或文件级别的数据迁移。
  • 整库迁移:支持在同构、异构数据源之间进行整库迁移。
  • 增量数据迁移:支持文件增量迁移、关系型数据库增量迁移、HBase/CloudTable增量迁移,以及使用Where条件配合时间变量函数实现增量数据迁移。
  • 事务模式迁移:支持当CDM作业执行失败时,将数据回滚到作业开始之前的状态,自动清理目的表中的数据。
  • 字段转换:支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。
  • 文件加密:在迁移文件到文件系统时,CDM支持对写入云端的文件进行加密。
  • MD5校验一致性:支持使用MD5校验,检查端到端文件的一致性,并输出校验结果。
  • 脏数据归档:支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中,便于用户查看。并支持设置脏数据比例阈值,来决定任务是否成功。
  • 正则表达式分隔半结构化文本:支持在创建表/文件迁移作业时,对简单CSV格式的文件,可以使用字段分隔符进行字段分隔。

应用场景

CDM提供了大数据迁移上云、数据批量入湖两种应用场景。

  • 大数据迁移上云场景使用大数据云服务的弹性和按需能力作为线下自建大数据平台的替代或备用,数据量大,全量迁移。

  • 数据批量入湖场景支持用户本地数据全量和T+1增量入湖。

CDM的使用过程

CDM使用简单,您只需通过可视化界面对数据源和迁移任务进行配置,CDM会对数据源和任务进行全面的管理和维护,您只需关注数据迁移的具体逻辑,无需关心环境等问题,极大降低了开发维护成本。

Step1 创建CDM集群

一个CDM集群运行在一个弹性云服务器之上,您可以在集群中创建数据迁移作业,在云上和云下的同构/异构数据源之间批量迁移数据。

目前CDM支持以下规格供用户选择:

  • large
  • xlarge
  • cdm.4xlarge

Step2 创建数据源连接

批量数据迁移有两种迁移方式,支持的数据源不相同:

  • 表/文件迁移:适用于数据上云、云服务间数据交换、云上数据迁移到本地业务系统。请参见表/文件迁移支持的数据源类型。
  • 整库迁移:适用于数据库上云,请参见整库迁移支持的数据源类型。

Step3 创建迁移作业

Substep1:配置源和目的连接器,创建连接

这里以MySQL导入到DWS为例,首先我们在源端作业配置中选择模式和表名,然后在目的端作业配置中选择要迁移到哪个表中,这里还可以配置是否自动创建目标表、DWS存储模式等选项。

Substep2:配置字段映射

CDM会自动匹配源端和目的端的数据表字段,这里系统会按照自然顺序列出来,如果需要调整的话,可以调整字段的映射关系。

Substep3:配置任务配置信息,并运行作业

配置任务调度信息,可以配置定时任务,是否写脏数据,任务并发数等参数。

执行结果的这个截图这是一个真实的测试数据,这个MySQL到DWS作业迁移了一亿条记录,数据量大约14GB,使用了5分38秒,每秒迁移接近30万条数据。

还等什么,实践一下,快去体验云数据迁移更多功能吧!

了解更多云数据迁移信息,戳这里。

点击关注,第一时间了解华为云新鲜技术~

云小课|云小课带你快速掌握云数据迁移CDM的更多相关文章

  1. 阿里云语音合成(汉语英语)带UI界面的小程序(python)

    一,项目说明 将汉文转汉语.英文转英语,同时又有逗号<###English###>,<,,,>和句号<...>标志符用于文件处理.其中英文包含在### 英文 ### ...

  2. 【阿里云产品评测】小站长眼中的巅峰云PK

    [阿里云产品评测]小站长眼中的巅峰云PK 阿里云论坛用户:昵称-a5lianmeng 笔者是一名小站长,因狂热互联网,而在毕业后由宅男逐渐进入站长队伍,在毕业后的几年间,经营6个流量类网站,身为站长, ...

  3. 腾讯云 Game-Tech 技术沙龙小游戏专场“空降”长沙

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯游戏云发表于云+社区专栏 小游戏作为今年快速成长的新生态,在开放进入市场之后持续成为行业热点,获得了游戏开发商的高度关注与参与.在 ...

  4. 微信小程序云开发-从0打造云音乐全栈小程序

    第1章 首门小程序“云开发”课程,你值得学习本章主要介绍什么是小程序云开发以及学习云开发的重要性,并介绍项目的整体架构,真机演示项目功能,详细介绍整体课程安排.课程适用人群以及需要掌握的前置知识.通过 ...

  5. 基于小程序云Serverless开发微信小程序

    本文主要以使用小程序云Serverless服务开发一个记事本微信小程序为例介绍如何使用小程序云Serverless开发微信小程序.记事本小程序的开发涉及到云函数调用.云数据库存储.图片存储等功能,较好 ...

  6. EasyNVR结合阿里云/腾讯云CDN实现微信/小程序直播的方案

    背景需求: 许多客户有这样的需求:微信公众号做为平台来对摄像机进行直播:可以让用户随时随地打开公共号就可以观看:保证画面的流畅性:保证视频的并发访问量等. 问题分析: 虽然需求看似很简单,其实真正实现 ...

  7. 华为云亮相QCon2020深圳站,带你体会大厂的云原生玩法与秘诀

    摘要:在QCon全球软件开发大会上,华为云开发者生态总监张全文作为"云原生应用开发实践"专题出品人,携手华为云四位资深技术专家带来精彩分享. 作为当下技术领域最火热的技术趋势之一, ...

  8. Plupload上传实例《模仿微云上传实例》,带源码

    Plupload上传实例<模仿微云上传实例>,带源码,作者:鱼塘总裁 如有疑问,加群交流:646104701 一.实例截图 1.上传过程 2.上传成功 3.上传失败 4.最小化 二.所需文 ...

  9. 【Dubbo3 终极特性】「云原生三中心架构」带你探索 Dubbo3 体系下的配置中心和元数据中心、注册中心的原理及开发实战(中)

    承接上文 通过之前的[Dubbo3终极特性]「云原生三中心架构」带你探索 Dubbo3 体系下的配置中心和元数据中心.注册中心的原理及开发实战(上),让我们对Dubbo3的三中心架构体系有了一定的认识 ...

  10. 好消息!微信小程序开发环境自带vConsole

    背景介绍 事情是这样子的,我们在开发小程序的时候,需要在真机上把相关的日志打出来以便进行问题定位和回溯,于是在编程界就有个今天这个新闻.------ 好消息!广东某男子发现微信小程序开发环境自带vCo ...

随机推荐

  1. 深入理解maven构建生命周期和各种plugin插件(转)

    https://blog.csdn.net/zhaojianting/article/details/80321488 本博文不会长篇大论的讨论生命周期的概念,而是从各种plugin的实际功能和应用出 ...

  2. 如何通过 wireshark 捕获 C# 上传的图片

    一:背景 1. 讲故事 这些天计划好好研究下tcp/ip,以及socket套接字,毕竟工控中设计到各种交互协议,如果只是模模糊糊的了解,对分析此类dump还是非常不利的,而研究协议最好的入手点就是用抓 ...

  3. 集合-Nim游戏

    与普通\(NIM\)游戏不同的地方是限制了每次拿东西的个数,这个个数会给定在集合\(S\)中,也就是说每次拿的数量只能在集合\(S\)中. 现在就可以把每一堆石子看成是一个有向图了,最主要就是用记忆化 ...

  4. LabVIEW基于机器视觉的实验室设备管理系统(3)

    目录 行动计划 创建用户信息数据库 后面板连线 初始化 确认修改 确认id 判断旧密码是否正确 判断两次输入的新密码是否相同 修改用户数据库中的密码 结尾 效果演示 上一期我们完成了欢迎登录和信息查询 ...

  5. OpenSSL 使用AES对文件加解密

    AES(Advanced Encryption Standard)是一种对称加密算法,它是目前广泛使用的加密算法之一.AES算法是由美国国家标准与技术研究院(NIST)于2001年发布的,它取代了原先 ...

  6. css面试题随笔

    之前在前端群有个汉纸聊到他面试别人时问到:margin塌陷和margin合并问题如何解决? 然后我自己也懵逼了哈哈,因为只是遇到过并不知道这叫塌陷.合并哈哈哈················那我们一起 ...

  7. [USACO2007NOVG] Sunscreen

    题目描述 To avoid unsightly burns while tanning, each of the$ C (1 ≤ C ≤ 2500) $cows must cover her hide ...

  8. Java并发(十八)----常见线程安全类及实例分析

    1.常见线程安全类 String Integer StringBuffer Random Vector Hashtable java.util.concurrent (JUC)包下的类 这里说它们是线 ...

  9. C++ Qt开发:RadioButton单选框分组组件

    Qt 是一个跨平台C++图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍QRadioB ...

  10. 数据仓库——Hive

    数据仓库:是一个用于储存,分析,报告的数据系统 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持 数仓专注分析 数据仓库仓库为何而来,解决什么问题的? 为了分析数据而来,分析结 ...