记一次使用elasticsearch遇到bug的探索过程
背景:
练习一个小项目,爬取京东的数据,存到ES库中,然后读取ES库中数据,展示到页面上。效果图如下:
涉及两个接口,一个爬取写入ES接口,一个查询展示接口,当我写完代码信心满满准备看看效果的时候,调用爬取接口突然报了异常,因为我也是刚开始接触ES,所以对异常也是一脸的蒙,但本着有问题还是要解决的想法,开始分析原因。异常如下:
过程:
一开始我以为是我的程序并没有连上我的ES库,但是我试了一下查找方法,虽然查回来的数据是空的,但证明库还是连上了的。看着异常,顺着栈针找到自己的代码开始报错的地方,发现是调用ES的client入库的时候报的错,
BulkResponse rsBulk = restHighLevelClient.bulk(bulkRequest, RequestOptions.DEFAULT);
在这个地方debug,顺着栈轨迹一层一层的进入,来到了异常栈的栈底,也就是BulkRequest.class ,是这个类的validate()方法,看名字应该是个校验方法,对这个方法一点点看,在debug显示变量值时,发现了异常中的错误信息,那就是这个request的validate()报了现有的错。
"type is miss",type没有找到,ES库中确实有这个要求,但我找了一下代码,发现并没有调用方法传去type的地方,难道是我写错了?翻看了一下教程,发现没写错。找到了写入数据的地方
bulkRequest.add(new IndexRequest("jd_goods")
.source(JSON.toJSONString(jdCommodityInfo.get(i)),XContentType.JSON));
点进IndexRequest(String index),找到了返回的错误信息,
if (this.type == null) {
validationException = ValidateActions.addValidationError("type is missing", validationException);
}
错误的来源找到了,那是什么原因造成了这个错误呢?
回头看了一下我点进来的构造方法,猛的发现,这个构造方法里并没有type的定义
public IndexRequest(String index) {
this.opType = OpType.INDEX;
this.version = -3L;
this.versionType = VersionType.INTERNAL;
this.autoGeneratedTimestamp = -1L;
this.isRetry = false;
this.ifSeqNo = -2L;
this.ifPrimaryTerm = 0L;
this.index = index;
}
怪不得,你都没定义,验证的时候肯定报错啊!难道开源项目百年难得一遇的bug被我发现了,那我以后岂不是要升职加薪,当上总经理,出任CEO,赢取白富美,走上人生巅峰。为了验证我的想法,我找了一个带有type类型参数构造方法,进行了测试。
bulkRequest.add(new IndexRequest("jd_goods" ,"doc")
.source(JSON.toJSONString(jdCommodityInfo.get(i)),XContentType.JSON));
果然能执行成功。想想心里有点小激动,我要立刻去提Issues,去提Pr,不对,等等,我能遇见,别人也能遇见,而且我不是用的最近版本的ES,是不是已经被修复了。找了个高版本的ES代码,打开IndexRequ.clss找到validate(),果然被修复了,type判断已经被删除了。
总结:
虽然没能真正的修复一个开源项目的bug,到时候和同事,面试官好好的吹一下。但这个过程中真的学习到了,解决bug的思路。相信以后遇到未知bug的时候,也能轻松解决。
记一次使用elasticsearch遇到bug的探索过程的更多相关文章
- SQL Server 字段类型 decimal(18,6)小数点前是几位?记一次数据库SP的BUG处理
原文:SQL Server 字段类型 decimal(18,6)小数点前是几位?记一次数据库SP的BUG处理 SQL Server 字段类型 decimal(18,6)小数点前是几位? 不可否认,这是 ...
- 解Bug之路-记一次中间件导致的慢SQL排查过程
解Bug之路-记一次中间件导致的慢SQL排查过程 前言 最近发现线上出现一个奇葩的问题,这问题让笔者定位了好长时间,期间排查问题的过程还是挺有意思的,正好博客也好久不更新了,就以此为素材写出了本篇文章 ...
- 【分布式搜索引擎】Elasticsearch写入和读取数据过程
一.Elasticsearch写人数据的过程 1)客户端选择一个node发送请求过去,这个node就是coordinating node(协调节点)2)coordinating node,对docum ...
- android一个下拉放大库bug的解决过程及思考
android一个下拉放大库bug的解决过程及思考 起因 项目中要做一个下拉缩放图片的效果,搜索了下github上面,找到了两个方案. https://github.com/Frank-Zhu/Pul ...
- Bug,项目过程中的重要数据
作者|孙敏 为什么要做Bug分析? Bug是项目过程中的一个有价值的虫子,它不只是给开发的,而是开给整个项目组的. 通过Bug我们能获得什么? 积累测试方法,增强QA的测试能力,提升产品质量 发现项目 ...
- 记一个界面刷新相关的Bug
今天遇到一个比较有意思的bug, 这里简单记录下. Bug的症状是通过拖拉边框把我们客户端主窗口拖小之后,再最大化,会发现窗口显示有问题, 看起来像是刷新问题, 有些地方显示的不对了. 这里要说明的是 ...
- 记一次系统稳定性问题的分析处理过程(因CallContext使用不当而造成bug)
问题描述: 一个项目现场反馈,“差旅费类型的单据审批,在出现业务规则没满足的情况时(即业务报错,需要人机交互),审批仍然通过了”.从技术的角度上说,就是业务构件中的业务规则报错后,事务没有回滚.但是, ...
- [debug]记一次竞态更新bug的解决
公司的django项目,有一个旧接口,使用POST方法更新用户的一种记录型数据. 这个接口的历史有点长,最早的时候没有那么多需求,只会更新两个布尔字段.后来,加入一个需要高频次记录的字段.这些字段都属 ...
- 谁记录了mysql error log中的超长信息(记pt-stalk一个bug的定位过程)
[问题] 最近查看MySQL的error log文件时,发现有很多服务器的文件中有大量的如下日志,内容很长(大小在200K左右),从记录的内容看,并没有明显的异常信息. 有一台测试服务器也有类似的问题 ...
随机推荐
- 熬夜之作:一文带你了解Cat分布式监控
Cat 是什么? CAT(Central Application Tracking)是基于 Java 开发的实时应用监控平台,包括实时应用监控,业务监控. CAT 作为服务端项目基础组件,提供了 Ja ...
- 基于华为云IOT及无线RFID技术的智慧仓储解决方案最佳实践系列一
[摘要]仓储管理存在四大细分场景:出入库管理.盘点.分拣和货物跟踪.本系列将介绍利用华为云IOT全栈云服务,端侧采用华为收发分离式RFID解决方案,打造端到端到IOT智慧仓储解决方案的最佳实践. 仓储 ...
- 在CentOS7上源码安装OpenResty
您必须将这些库perl 5.6.1+libreadlinelibpcrelibssl安装在您的电脑之中. 对于 Linux来说, 您需要确认使用 ldconfig 命令,让其在您的系统环境路径中能找到 ...
- refs转发 React.forwardRef
2020-04-01 refs转发 前几天刚总结完ref&DOM之间的关系,并且想通了3种ref的绑定方式 今天总结一下refs转发 这是react中一直困扰我的一个点 示例: 输入: wor ...
- filebeat v6.3 如何增加ip 字段
我们知道filebeat获取数据之后是会自动获取主机名的,项目上有需要filebeat送数据的时候送一个ip字段出来 方法:配置filebeat配置文件 解释一下:field 是字段模块 在这个模块下 ...
- a标签伪类link,hover,active,visited,focus区别
<div id="content"> <h3><a class="a1" href="#">a标签伪类l ...
- PyCharm远程连接服务器简明教程
转自本人知乎(https://zhuanlan.zhihu.com/p/149040742) 由于实验室的GPU都是放在远程服务器上,因此一直使用MobaXterm利用SSH远程跑实验,但是MobaX ...
- Rigidbody(刚体)方法的初步学习(一)
概要:这次将简单的了解Rigidbody中的各种方法属性,以官方的API为顺序研究. 蛮牛API翻译:Rigidbody组件控制物体的位置—它使物体在重力影响下下落,并可计算物体将怎样响应碰撞.当操作 ...
- MDX
简介 把md文件里的图片转成base64,方便发给别人和上传博客园等博客平台 初衷 用Typora写markdown的感觉很爽,但是每当我写好一篇文章,想要发给小伙伴们炫耀炫耀,或者上传博客园,CSD ...
- TCP实战一(三握四挥、流量控制)
上一篇博文已经介绍了tcpdump的一些基本操作与命令,今天这篇博文将带你解密如何利用wireshark对tcpdump抓到的数据包进行可视化分析! 参考文献:https://zhuanlan.zhi ...