在数字化转型加速推进的背景下,数据生成规则作为数据工程的核心技术要素,其系统化应用已成为企业构建智能数据生态的关键路径。通过可配置的规则引擎实现数据的智能化构建。本文将结合ETLCloud平台的演示数据生成规则的使用技巧。

使用数据生成器规则中的生成6位随机数来演示

1.数据生成器

使用数据生成器生成3条数据

设置字段值id,并用数据生成规则中的生成6位随机数对他进行赋值

运行成功后查看日志,生成的3个id均为随机数

2.库表输入

以下是库表输入的场景

在第三步输入字段可以配置数据生成规则

下面是没有配置生成6位随机数的数据

把id字段绑定生成6位随机数

查看绑定生成6位随机数后的结果

3.库表输出

搭配数据生成器来演示

使用数据生成器生成3条如下数据

库表输出的配置,把id设为主键

运行流程,流程显示成功插入3条数据

但实际上数据库只插入了1条,因为id为主键不可重复

在库表输出中的输出字段里讲id配置上生成6位随机数,再次运行流程查看效果

可以发现数据已经成功插入了

4.数据清洗转换

搭配库表输入演示

这是库表输入的数据

绑定数据生成规则中的随机生成中文用户名

配置过滤条件只让id为123的name生成随机中文用户名

运行流程查看结果

5.文本文件读取

使用文本文件读取组件读取test.txt文件

在文本文件读取组件中的第三部输入字段可以配置数据生成规则,我们先不配置运行流程

可以看到输出的就是test.txt文件的内容

我们将id字段配置上数据生成规则中的生成随机6位数,再次运行流程效果

可以看到id已经是随机6位数的id了

6.Excel读取

使用Excel读取组件读取test.xlsx文件

以下是Excel读取组件的配置,标题列配置选择自定义字段

下面是字段配置,可以配置数据生成规则,现在先不配置,运行流程查看效果

可以看到字段已经配置成我们想要的字段了

现在将eid字段配置上生成6位随机数的数据生成规则,再次运行流程查看效果

可以看到eid的值已经变了

以上就是数据生成规则的技巧!

最后

数据生成规则通过灵活的配置与算法设计,显著提升了数据工程任务的自动化水平与数据质量。在具体应用中,需结合业务场景选择合适的生成策略,并通过唯一性校验、错误处理等机制保障数据一致性。未来可进一步探索结合机器学习生成更复杂的数据模式,以满足智能化数据治理的需求。

ETLCloud中数据生成规则使用技巧的更多相关文章

  1. 将表中数据生成SQL语句

    在开发过程中,经常需要我们对表中的数据进行转移,如果在同台机器,可以使用SQL自带的导入数据,但是如果想让所有的数据生成可执行的SQL语句,它的移植性最强了.首先要设计一个存储过程.具体如下: CRE ...

  2. loadrunner之Paramater在负载测试中的数据生成规则

    前段时间在做性能测试的时候,基于业务的需求,使用到了Unique Number的参数类型. 脚本的业务是注册以alien开头,后面接数字的用户帐号,填写相关帐号信息.提交企业信息进行审核. 其中用户帐 ...

  3. PLSQL大数据生成规则

    数据定义 数据定义决定了被生成的数据.如果要创建简单的字符,可以在两个方括号之间输入字符定义:[数据] 数据可以是下列预先确定的集的混合体:           •  a: a..z (小写字符)   ...

  4. 使用IO流将数据库中数据生成一个文件,结果使用Notepad++打开部分数据结尾出现NUL

    场景描述: 项目中通过java代码中从数据库中查询一系列数据,对数据做相应处理,然后通过字符流将数据写如一个新生成的文件中,将该项目部署在linux服务器上,最后生成的文件拿到本地使用notepad+ ...

  5. plsql中数据生成工具data generator的使用

    使用数据库时,有时需要使用大量的数据,可以用PLSQL Developer提供的Data Generator工具, 这里记录一下工具的介绍及几个使用注意事项 1.工具介绍 功能入口位于 工具 菜单下, ...

  6. java中json数据生成和解析(复杂对象演示)

    1.json简单介绍 1.1 json是最流行和广泛通用的数据传输格式,简称JavaScript Object Notation,最早在JavaScript中使用. 1.2 举个例子,下面是一个jso ...

  7. 对抗生成网络-图像卷积-mnist数据生成(代码) 1.tf.layers.conv2d(卷积操作) 2.tf.layers.conv2d_transpose(反卷积操作) 3.tf.layers.batch_normalize(归一化操作) 4.tf.maximum(用于lrelu) 5.tf.train_variable(训练中所有参数) 6.np.random.uniform(生成正态数据

    1. tf.layers.conv2d(input, filter, kernel_size, stride, padding) # 进行卷积操作 参数说明:input输入数据, filter特征图的 ...

  8. m_Orchestrate learning system---十四、数据表中字段命名规则

    m_Orchestrate learning system---十四.数据表中字段命名规则 一.总结 一句话总结:a.保证唯一 b.见名知意 1.注意php中的数组类函数和字符串类函数的前缀? 数组类 ...

  9. Oracle中使用hash_hmac() 函数报错问题/以及Oracle遇到Oauth1.0授权和oauth_signature生成规则

    最近在Oracle上发现使用hash_hmac()报找不到此函数.为此特意查到oracle的文档.详细请看官网回答:https://cx.rightnow.com/app/answers/detail ...

  10. 按指定规则统计list中数据,groupby用法

    有的情况下,只是想要简单地对list中数据,进行分组,查看,可以考虑使用groupby 代码: # groupby需要排序后才能使用 def gb(num): if 0 <= num < ...

随机推荐

  1. Elasticsearch7.6.1配套安装包自取

    包含Elasticsearch,ik分词器,kibana 7.6.1安装包自取:https://pan.baidu.com/s/1Y6XdDOzqIzI2qerOODQHmg提取码:5nm4

  2. C#自动属性提供默认值的方法

    编程之路转自:cjavapy.com/article/55/ _  .NET(C#)中,自动属性(Auto-Implemented Properties)提供了一种简洁的方式来实现属性而无需显式定义字 ...

  3. 腾讯Java后端一面,被速通了!

    分享一篇腾讯的后端Java一面凉经,被速通了, 大家感受一下难度如何. 这次面试的考察覆盖了从 项目经验的深度挖掘(面试官非常看重 STAR 法则的应用)到 扎实的计算机基础(经典的 TCP/UDP ...

  4. 40.8K star!让AI帮你读懂整个互联网:Crawl4AI开源爬虫工具深度解析

    嗨,大家好,我是小华同学,关注我们获得"最新.最全.最优质"开源项目和高效工作学习方法 Crawl4AI 是2025年GitHub上最受瞩目的开源网络爬虫工具,专为AI时代设计.它 ...

  5. K8s新手系列之Pod中容器的镜像拉取策略

    概述 在 Kubernetes(K8s)里,容器镜像拉取策略(ImagePullPolicy)决定了 K8s 在创建或重启 Pod 时,如何处理容器镜像的拉取操作.这一策略能够确保使用的镜像始终是最新 ...

  6. Oracle链接服务器导致SQL Server异常终止

    现象 首先该链接服务器是使用 OraOLEDB provider (OLEDB Provider for Oracle)创建的,在使用该链接服务器的SQL语句中出现特殊字符 "--" ...

  7. WPF的Image控件图片不能显示出来

    在Visual studio中,将图片的属性的"生成操作"从"无"改为"资源". 最终解决问题:

  8. 第8讲、Multi-Head Attention 的核心机制与实现细节

    为什么要有 Multi-Head Attention? 单个 Attention 机制虽然可以捕捉句子中不同词之间的关系,但它只能关注一种角度或模式. Multi-Head 的作用是: 多个头 = 多 ...

  9. 堆排序算法Java实现

    摘要 介绍堆排序的基本概念及其实现. 前言   排序大的分类可以分为两种:内排序和外排序.在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序.这里讲的排序是内排序 ...

  10. 2024牛客多校2B MST

    同步发布于我的网站. Problem Sajin最近深入研究了最小生成树,现在他已经掌握了MST的算法.他渴望通过一系列查询来评估您对最小生成树概念的掌握程度. 您将面临一个加权无向图,该图包含没有任 ...