更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

2022 年 10 月,字节跳动 BitSail 数据引擎正式开源。同期,社区推出 Contributor 激励计划第一期,目前已有 21 位外部开发者为 BitSail 社区做出贡献,成为了首批 BitSail Contributor。

江海的广阔是由每一滴水珠构成的,BitSail 社区永远欢迎每一位开发者的加入。我们推出本档“对话 BitSail Contributor”栏目,是想用自己的方式为每一位 Contributor 留下与 BitSail 紧密相关的独立记录。正因为有你们、有今后更多的 Contributor 存在,BitSail 才能像起名初衷一样,在数据的海洋里以代码做船帆,向无边际的远方勇敢航行。

“BitSail 为我的社区开发之路提供了很大的动力” ,今天的这位 Contributor 在贡献过程中有着怎样的心得?她对 BitSail 社区的未来发展有着什么样的期待?接下来就让我们一起听听她怎么说~

(PS:本栏目 Contributor 文章排序无前后、贡献大小之分,按内容提交顺序进行推送~~)

社区贡献

认领了 issue :

1.https://github.com/bytedance/bitsail/issues/258

优化了 BitSail Kudu 模块 Row Data 解析功能,通过 runtime context 来解析 Row Data

2.https://github.com/bytedance/bitsail/issues/417

完善了 BitSail 通用字段类型检测及转化的部分功能,主要包括:

1.完善 BitSail 通用字段类型检测过程中的异常信息校验及输出

2.完善 MongoBD 字段类型检测的单测功能

与 BitSail 结缘过程

22 年 11 月 BitSail 开源并且相关同学组织了分享活动,听了开发同学的分享之后了解到 BitSail 的功能定位是支持多种异构数据源之间的数据同步并提供了离线,实时,增量及全量场景下全域数据集成方案,实现了流批一体湖仓一体架构,并行度计算异常数据检测阈值设定等功能是目前业绩较为领先及完善的数据集成方案,由此引起了我对其具体实现的好奇并开始了我的 BitSail 学习之旅。

贡献动力

经过一段时间的学习研究发现 BitSail 项目源代码质量很高,代码规范及 CICD 测试流程完善,基于 Flink 引擎实现了流批一体湖仓一体架构,无论是代码设计还是实现方案对于大数据领域的同学都有很高的学习价值。另外,BitSail 运营同学对于社区贡献也是积极的宣传,开发同学会耐心解答我们遇到的问题。以上都对我的社区开发之路提供了很大的动力。

社区初印象

加入 BitSail 社区之后发现社区很完善,无论是代码规范还是 CICD 测试流程都比较完善,并且在进行活跃的迭代。BitSail 运营同学和开发同学都会对新加入社区的同学提供帮助解决我们遇到的问题。

未来对 BitSail 的期待

希望 BitSail 能够不断推出社区活动保持社区的活跃度,功能方面希望尽快落地 Local Engine 提高简单场景的资源利用率,统一 CDC 数据入湖的解决方案,支持 K8S 云原生,开箱即用拓展 BitSail 的使用场景。

持续关注,更多“对话 BitSail Contributor 内容”正在路上~~

加入社群,获取更多精彩!

了解更多 BitSail 信息

️ Star 不迷路(BitSail 代码仓库):https://github.com/bytedance/bitsail

提交问题和建议:https://github.com/bytedance/bitsail/issues

贡献代码:https://github.com/bytedance/bitsail/pulls

BitSail 官网:https://bytedance.github.io/bitsail/zh/

订阅邮件列表:bitsail+subscribe@googlegroups.com

对话 BitSail Contributor | 吴畅:从好奇,到深入的更多相关文章

  1. 打开网页自动弹出QQ对话框的实现办法

    Ian今天偶然进入一个公司的企业网站,然后QQ聊天窗口这里马上就弹出与那个公司客服聊天的窗口.怀着好奇的心态,Ian分析了该公司的网站源码,发现了实现网页弹出qq对话框的原理与实现方法,相信此时此刻你 ...

  2. 吴裕雄--天生自然KITTEN编程:对话

  3. [C0] 人工智能大师访谈 by 吴恩达

    人工智能大师访谈 by 吴恩达 吴恩达采访 Geoffery Hinton Geoffery Hinton主要观点:要阅读文献,但不要读太多,绝对不要停止编程. Geoffrey Hinton:谢谢你 ...

  4. 2017年度好视频,吴恩达、李飞飞、Hinton、OpenAI、NIPS、CVPR、CS231n全都在

    我们经常被问:机器翻译迭代了好几轮,专业翻译的饭碗都端不稳了,字幕组到底还能做什么? 对于这个问题,我们自己感受最深,却又来不及解释,就已经边感受边做地冲出去了很远,摸爬滚打了一整年. 其实,现在看来 ...

  5. 怎样让你的安卓手机瞬间变Firefox os 畅玩firefox os 应用

    Firefox os 手机迟迟不能在国内大面积上市.如今能买到的Firefox os手机国内就一款Firefox os ZET OPEN C ,但这款手机配置确实还不如人意.价格方面也不实惠,对于我们 ...

  6. 美图吴欣鸿:请不要叫我CEO

    关于采访提纲上“对互联网+如何理解?”的问题能否不做回答? 他的说法听上去谦虚而实在,“我一般对于这种大的.有点政策性的问题其实是Hold不住的,我的谈话风格就是比较随性.感性,也很难说去推出一个很强 ...

  7. 訪问的网页自己主动打开QQ对话

    今天訪问中国论文网,自己主动就弹出与QQ的对话框,非常是好奇.于是查看网页源码发现例如以下可疑处: <script type="text/javascript"> fu ...

  8. 【吴节操点评】中国企业SaaS应用深谙未来者寥寥数几 两极分化将加剧

    数年前,在国外企业级应用如火如荼的时候.国内却是一片空白.而现在企业SaaS应用市场,包含用友.金蝶.东软在内的三巨头.已经有数十家之多.相比美国3000亿美元的企业应用三巨头来说,中国企业应用前三甲 ...

  9. 百度大脑UNIT3.0详解之知识图谱与对话

    如今,越来越多的企业想要在电商客服.法律顾问等领域做一套包含行业知识的智能对话系统,而行业或领域知识的积累.构建.抽取等工作对于企业来说是个不小的难题,百度大脑UNIT3.0推出「我的知识」版块专门为 ...

  10. 关于.net的精彩对话(转)

    [序言]我想很多爱好软件编程的网友都像我一样,对微软推出的.net平台充满了好奇,但是看了相关的文档也是一头雾水,还好,Purple很幸运在QQ上遇到了一位.net高手,经过高手的一番教导,Purpl ...

随机推荐

  1. 1. JVM内存区块

    本篇文章主要讲解Java(JVM)在运行期间,其运行时数据区域的作用.职责与划分.包括堆内存.栈内存--虚拟机栈.本地方法栈.方法区.常量池.程序计数器等概念. 采集可以使用JavaMXBean(采集 ...

  2. 手撕Vuex-模块化共享数据上

    前言 好,经过上一篇的介绍,实现了 Vuex 当中的 actions 方法,接下来我们来实现 Vuex 当中的模块化共享数据(modules). modules 方法用于模块化共享数据,那么什么叫模块 ...

  3. kubernetes驱逐机制总结

    概述 k8s的驱逐机制是指在某些场景下,如node节点notReady.node节点压力较大等,将pod从某个node节点驱逐掉,让pod的上层控制器重新创建出新的pod来重新调度到其他node节点. ...

  4. NewsCenter

    打开界面有一个搜索框 抓包查看是post形式提交的数据包 这时候试试sql注入,万能密码直接全都显示,那就说明存在sql注入漏洞 这里试试用sqlmap自动注入试试(POST类型的sql注入第一次尝试 ...

  5. WebGL初接触

    有感于在不少jd中看到关于WebGL的内容,想起来之前在高程中还没看完的canvas,就匆匆把剩余的一点看完了,高程中的内容还是皮毛,就属于很基础的.概念性的东西. WebGL 画布的3D上下文.不是 ...

  6. 金蝶对接电商ERP库存数据,实现监听库存变化

    金蝶云星空实时库存专题 通过向金蝶库存单据注册Python脚本,用于实时监听库存单据审核/反审核,并且将数据发送到轻易云系统集成平台 .通过集成平台将数据分发到对应的目标系统. 向金蝶的库存单据注册脚 ...

  7. DDD学习与感悟——总是觉得自己在CRUD怎么办?

    一.DDD是什么? DDD全名叫做Domins drives Design:领域驱动设计.再说的通俗一点就是:通过领域建模的方式来实现软件设计. 问题来了:什么是软件设计?为什么要进行软件设计? 软件 ...

  8. jdk21的外部函数和内存API(MemorySegment)(官方翻译)

    1.jdk21:   引入一个 API,通过该 API,Java 程序可以与 Java 运行时之外的代码和数据进行互操作.通过有效地调用外部函数(即JVM外部的代码)和安全地访问外部内存(即不由JVM ...

  9. java文件读取 while ((len = reader.read(buffer)) != -1){}的理解

    源文件 InputStreamReader reader=new InputStreamReader(new FileInputStream(file),"UTF-8"); //读 ...

  10. Tensorflow2.0实战之GAN

    本文主要带领读者了解生成对抗神经网络(GAN),并使用提供的face数据集训练网络 GAN 入门 自 2014 年 Ian Goodfellow 的<生成对抗网络(Generative Adve ...