Doris-HDFS LOAD常见问题汇总(二)
本文分享自天翼云开发者社区《Doris-HDFS LOAD常见问题汇总(二)》,作者:刘****阳
1、HDFS Load导入错误,quality not good enough to cancel,
- 现象描述:导入显示状态为Canceled,URL错误详情显示:quality not good enough to cancel
- 可能原因:
- 1、导入的数据字段长度设置有问题,原始数据超长。
- 2、导入的数据被异常切分了。字段值中含有换行或者文件解析错误。
- 3、字段对应错误,字段值字段转换异常。
- 定位方式:
- 查询任务状态show load where label="" from db_name;
- show load warnings on "URL" 。日志详情里显示具体错误详情。
- 解决方案:
- 1、字段值超长可以修改字段值或者截断原始数据。
- 2、数据被异常切分,需探查所有数据还是极少数数据,极少数数据可通过设置允许脏数据来自动过滤部分脏数据。
- 3、字段对应错误或者字段转换异常,对应设置相应的set进行显式转换。
2、HDFS Load数据同步到doris丢失了 ,我检查了一下总数 发现掉了几十万 找个帮忙看看是什么原因吗
- 现象描述:导入后数据少了很多
- 可能原因:
- 1、数据导入任务有大量脏数据,当设置允许脏数据,可能会过滤
- 2、导入的格式是Parquet格式,但在任务中未指定,默认引擎同步异常
- 3、原始数据重新生成。
- 定位方式:
- 确认是否设置允许脏数据,如果允许可查看ETLinfo详情里查询具体导入情况。
show load where label="" from db;
unselected.rows=0; dpp.abnorm.ALL=18; dpp.norm.ALL=221221
- 查询原始数据的文件格式是什么
2. 查询原始数据生成时间,是否更新为数据导入任务后,或者有增量数据生成。
- 解决方案:
- 1、字段值超长可以修改字段值或者截断原始数据。
- 2、数据被异常切分,需探查所有数据还是极少数数据,极少数数据可通过设置允许脏数据来自动过滤部分脏数据。
- 3、字段对应错误或者字段转换异常,对应设置相应的set进行显式转换。
3、HDFS Load导入错误,quality not good enough to cancel,
- 现象描述:导入显示状态为Canceled,错误详情为
type:ETL_RUN_FAIL; msg:errCode = 2, detailMessage = HDFS list path exception. path=hdfs://user/XXXXXXXXXXX/5G_D/20240418/*, err: errCode = 2, detailMessage = HDFS list path failed. path=hdfs://user/XXXXXXXXXX/5G_D/20240418/*,msg=errors while get file status java.net.UnknownHostException: user
- 可能原因:
- 1、host设置异常
- 定位方式:
- 确认配置的HDFS路径是否正确。
- 解决方案:
- 修改正确HDFS路径后,重新导入。
4、HDFS Load导入错误, No source file
- 现象描述:导入显示状态为Canceled,错误详情为
type:ETL_RUN_FAIL; msg:errCode = 2, detailMessage = No source file in this table(o_zXXXXX_d).
- 可能原因:
- HDFS路径配置错误,或者HDFS目录下没有相关文件。
- 定位方式:
- 确认配置的HDFS路径是否正确。
- 确认原始的数据是否正常生成。
- 解决方案:
- 修改正确HDFS路径后或生成原始数据后,重新导入。
5、HDFS Load导入错误,中文字段 the length of input is too long than schema.
- 现象描述:导入显示状态为Canceled,URL详情为
Reason: column_name[con_bis_type], the length of input is too long than schema. first 32 bytes of input str: [用户姓名] schema length: 10; actual length: 12; . src line [];
- 可能原因:
- 中文字段在Doris中单个汉字长度为3.
- 定位方式:
- 查看原始数据的长度
- 解决方案:
- 修改表字段的长度,重新导入。
ALTER TABLE example_db.my_table MODIFY COLUMN val1 VARCHAR(64)
Doris-HDFS LOAD常见问题汇总(二)的更多相关文章
- J2EE进阶(十一)SSH框架整合常见问题汇总(二)
org.hibernate.PropertyAccessException: IllegalArgumentException occurred while calling setter of cn. ...
- CentOS安装Oracle数据库详细介绍及常见问题汇总
一.安装前准备 1.软件硬件要求 操作系统:CentOS 6.4(32bit)Oracle数据库版本:Oracle 10g(10201_database_linux32.zip)最小内存:1G(检查命 ...
- SVN集中式版本控制器的安装、使用与常见问题汇总
SVN是Subversion的简称,是一个开放源代码的版本控制系统,它采用了分支管理系统,集中式版本控制器 官方网站:https://www.visualsvn.com/ 下载右边的服务器端,左边的客 ...
- H5项目常见问题汇总及解决方案
H5项目常见问题汇总及解决方案 H5 2015-12-06 10:15:33 发布 您的评价: 4.5 收藏 4收藏 H5项目常见问题及注意事项 Meta基础知识: H5页 ...
- MVC 网站部署常见问题汇总
一:TGIShare项目是一个MVC5的网站程序,部署在了IIS上,使用的Windows验证方式,并在本机设置了计划任务定时调用某个地址执行命令.问题汇总如下: 1.Window Server 200 ...
- 转---CentOS安装Oracle数据库详细介绍及常见问题汇总
一.安装前准备 1.软件硬件要求 操作系统:CentOS 6.4(32bit)Oracle数据库版本:Oracle 10g(10201_database_linux32.zip)最小内存:1G(检查命 ...
- thymeleaf的常见问题汇总
thymeleaf的常见问题汇总 1.thymeleaf th:href 多个参数传递格式 th:href="@{/Controller/update(param1=1,param2=${p ...
- gpload导入常见问题汇总
gpload导入常见问题汇总 java写文件后使用gpload命令导入greenplum: 问题一: 报错信息:invalid byte sequence for encoding "UTF ...
- H5 常见问题汇总及解决方案
原文链接:http://mp.weixin.qq.com/s/JVUpsz9QHsNV0_7U-3HCMg H5 项目常见问题汇总及解决方案 -- 由钟平勇分享 转自 https://github.c ...
- Nuxt.js的踩坑指南(常见问题汇总)
本文会不定期更新在nuxt.js中遇到的问题进行汇总.转发请注明出处,尊重作者,谢谢! 强烈推荐作者文档版踩坑指南,点击跳转踩坑指南 在Nuxt的官方文档中,中文文档和英文文档都存在着不小的差异. 1 ...
随机推荐
- QT 可绑定属性 QProperty QObjectBindableProperty QObjectComputedProperty,简化信号、槽(SIGNAL、SLOT)机制的方法
QT提供的可绑定属性是指这些属性可以绑定到其他值或表达式上(通常是 C++ lambda 表达式).如果属性是通过表达式进行绑定,该属性会跟随表达式自动更新.可绑定属性由 QProperty 类和 Q ...
- VScode前端代码编辑器:修改默认打开的浏览器和代码提示设置
一.修改默认打开的浏览器 二.代码提示设置
- 🎀腾讯云nodejs SDK打包体积过大吐槽事件
简介 2025年2月1日有位开发同学batchor在GitHub上提出了issue(你们是把***打包了吗?)对腾讯云Node.js的SDK打包体积过大进行吐槽(言语偏贴吧风格略显激进),SDK打包体 ...
- MySQL 中 EXISTS 和 IN 的区别是什么?
在 MySQL 中,EXISTS 和 IN 都用于在子查询中进行条件判断,但它们的使用场景和性能有一定区别.以下是 EXISTS 和 IN 的主要区别: 1. 功能和用法 EXISTS: EXISTS ...
- UT
Mockito 官网 注解
- Java 线程的常用操作方法
目录 线程命名和取得 线程的休眠 线程优先级(priority) 线程命名和取得 如果想要进行线程名称的操作,可以使用Thread类的如下方法: 构造方法:public Thread(Runnable ...
- 【HUST】网安|软件安全课设|记录
仓库链接 clone之后点开html文件即可使用. 效果如下图: 文章目录 进程通信设计 共享内存(Windows) 初始化共享内存 修改和读取共享内存的内容 共享内存(linux) (尝试使用,但使 ...
- Flutter适配HarmonyOS 5开发知识地图
还在为Flutter适配HarmonyOS 5头疼?这份知识地图,用实战解析+高频避坑指南,帮你快速打通跨平台开发任督二脉! ▌为什么这份资源值得你收藏? 分层进阶:从环境搭建→插件开发→性能优化,匹 ...
- Python 潮流周刊#101:Rust 开发的 Python 类型检查工具(摘要)
本周刊由 Python猫 出品,精心筛选国内外的 250+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...
- 编译原理:中间代码IR
IR,中间代码(Intermediate Representation,有时也称为Intermediate Code,IC),它是编译器中很重要的一种数据结构.编译器在做完前端工作以后,首先就生成IR ...