Kettle通过Http post请求webservice接口以及结果解析处理
kettle中有两种方式请求webservice服务,一个是Web服务查询,但是这个有缺陷,无法处理复杂的需求,遇到这种情况就需要用Http post来处理了。
网上也有很多关于Http post请求webservice服务的,但是无一例外的都对请求响应后的结果没有做出处理的教程,调用结果最终目的是为了拿到数据,有时候返回的是一个xml格式的集合,就需要用【XML文件输入】来解析每一个节点。而SOAP标准的响应结果不能直接用【XML文件输入】进行解析,下面就针对这种情况该如何处理做个简单的介绍。
转换脚本预览:
主要包括获取变量、设置参数(SOAP请求入参)、发起请求(Http post)、获取body(过滤soap响应结果)、解析xml等;

第一步:获取变量
这里定义入参的值,模拟作业情况下上一步骤传过来的参数,这里直接设置默认值,在下一个步骤中使用。

我这里定义了三个参数,分别为orgCode、deptCode、staffName。
第二步:设置参数
这里主要是安装SOAP接口参数格式定义入参,他有一定标准的格式,其中蓝色框是接口的真正入参,动态变化的是红色框,也就是上一步传进来的参数,通过占位符的方式赋值。
这里用到了E4X,E4X 是添加了对 XML 支持的 JavaScript 正式标准,通过 E4X,可以通过声明变量的方法来声明 XML 对象变量;

第三步:发起请求
需要填入接口地址,选择字符编码为UTF-8,上一步骤传过来的入参,及响应结果变量名称,另外根据接口情况可能还需要设置头部信息之类的,在Fields页面设置,我的接口不需要,这里就不做展示。

第四步:获取body
下面是我的webService接口通过SoapUI工具测试的响应的结果示例:
<soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">
<soap:Body>
<ns2:getDataResponse xmlns:ns2="http://webservice.ks.com">
<ns2:return>
<result>
<staff>
<identityNo>身份证号码0</identityNo>
<employeNo>工牌号0</employeNo>
<spellCode>拼音码0</spellCode>
<deptName>所属部门名称0</deptName>
<sexCode>性别代码0</sexCode>
<staffNo>员工内部号0</staffNo>
<sexName>性别名称0</sexName>
<staffName>员工姓名0</staffName>
<account>账户0</account>
<staffBirthdate>出生日期0</staffBirthdate>
<deptCode>所属部门代码0</deptCode>
</staff>
<!-- 以下忽略部分staff-->
</result>
<code>100</code>
<success>true</success>
<message>查询成功</message>
</ns2:return>
</ns2:getDataResponse>
</soap:Body>
</soap:Envelope>
我的目的是获取到节点result下的所有staff节点的内容,所以需要用到【XML文件输入】来解析这些节点。但是如果直接把响应结果进行解析,不管选择那个节点,执行时会报错:Can not apply XPath!


所以需要通过JavaScript脚本解析响应结果,只获取Body下的返回值内容:

其中转义符转换可以忽略,因为我的webservice接口通过http post请求返回的结果将<>符号进行转义,所以需要转成符号才可以进行下一步。
kettle中JavaScript脚本没有replaceAll()函数,所以如果要替换所有就需要用到正则表达式去找到要替换的内容。
首先是将Http post请求响应的字符串结果创建一个出XML对象,然后获取soap的命名空间及响应结果的命名空间,根据这些信息拿到响应结果的body部分,最后转成格式化的字符串输出。
最终responseXML为:
<ns2:getDataResponse xmlns:ns2="http://webservice.ks.com">
<ns2:return>
<result>
<staff>
<identityNo>身份证号码0</identityNo>
<employeNo>工牌号0</employeNo>
<spellCode>拼音码0</spellCode>
<deptName>所属部门名称0</deptName>
<sexCode>性别代码0</sexCode>
<staffNo>员工内部号0</staffNo>
<sexName>性别名称0</sexName>
<staffName>员工姓名0</staffName>
<account>账户0</account>
<staffBirthdate>出生日期0</staffBirthdate>
<deptCode>所属部门代码0</deptCode>
</staff>
<!-- 以下忽略部分staff-->
</result>
<code>100</code>
<success>true</success>
<message>查询成功</message>
</ns2:return>
</ns2:getDataResponse>
再用【XML文件输入】来解析responseXML就成功了

后来,我惊讶的发现,获取body这个步骤这么复杂,目的不就是只取getDataResponse吗,那我是不是可以通过replace()函数把前后部分去掉呢?
于是我的获取body步骤变成了:

然后打印输出到excel也是可以的:

Kettle通过Http post请求webservice接口以及结果解析处理的更多相关文章
- 请求webservice接口的某方法数据
NSURL *url = [NSURL URLWithString:@"http://xxx.xxx.com/xxx/xxxxWS?wsdl"]; NSString *soapMs ...
- java使用POST发送soap报文请求webservice返回500错误解析
本文使用JAX-WS2.2编译webservice,并使用HttpUrlConnection的POST方式对wsdl发送soap报文进行请求返回数据, 对错误Server returned HTTP ...
- C++webservice接口调用
一.WebService例子 1.准备要调用的webservice接口的wsdl地址,比如网上的查询天气接口:http://ws.webxml.com.cn/WebServices/WeatherWS ...
- ajax跨域请求调用webservice接口
1.WebService 接口编写 步骤:新建web项目=>添加web service=>编写方法接口=>然后发布(本地测试可以直接把这个web service运行起来). 关键如何 ...
- 通过jmeter发送webservice接口请求
1.webservice接口地址:http://ip:port/...?wsdl 2.接口数据类型:<cuxGmiChukuRmaTrxV><salesrepId xmlns:xsi ...
- Node.js 使用 soap 模块请求 WebService 服务接口
项目开发中需要请求webservice服务,前端主要使用node.js 作为运行环境,因此可以使用soap进行请求. 使用SOAP请求webservice服务的流程如下: 1.进入项目目录,安装 so ...
- python通过http请求发送soap报文进行webservice接口调用
最近学习Python调用webservice 接口,开始的时候主要采用suds 的方式生产client调用,后来发现公司的短信接口采用的是soap报文来调用的,然后开始了谷歌,最后采用httplib ...
- 从xfire谈WebService接口化编程
前段时间有博友在看我的博文<WebService入门案例>后,发邮件问我关于WebService 接口在java中的开发,以及在实际生产环境中的应用.想想自己入职也有一段时间了,似乎也该总 ...
- ab post 测试 http 和 webservice 接口方法及用例
1.ab测试简单http请求 ab -n30000 -c1000 "http://10.1.1.21:8080/" 2.ab 测试 http 接口 (POST) ab -n400 ...
随机推荐
- 5.PHP与Web页面交互
PHP与Web页面交互 PHP中提供了两种与Web页面交互的方法,一种是通过Web表单提交数据,另一种是通过URL参数传递. 表单提交用户名字和密码: <form name "form ...
- Docker 搭建一个多端同步网盘-Nextcloud
hub 官网
- 远程分支git换地址了,本地重新关联
由于本人把github远程仓库的名字修改了所以做了以下步骤修改 步骤:两步 (1)先把之前关联的git清除掉 git remote rm origin (2)再关联新的地址 git remote ad ...
- Docker为PHP安装gd扩展
安装扩展库的通常命令 docker-php-ext-install 扩展库名 安装gd库需要特殊照顾,步骤如下 //进入PHP容器 //更新软件源 apt update //安装各种库 apt ins ...
- killable thread的python实现
python没有为内置的threading.Thread类提供一个kill接口,可以通过使用CPython API向线程抛出一个SystemExit异常来终止线程.如果线程没有被系统调用阻塞(slee ...
- linux 查看运行java所在目录
通过ps及top命令查看进程信息时,只能查到相对路径,查不到的进程的详细信息 需要查看pos_service.jar的绝对路径(在哪里目录下) 使用:ll /proc/PID Linux在启动一个进 ...
- Spring Cloud Alibaba(8)---Feign服务调用
Feign服务调用 有关Spring Cloud Alibaba之前写过五篇文章,这篇也是在上面项目的基础上进行开发. Spring Cloud Alibaba(1)---入门篇 Spring Clo ...
- Nebula Graph 的 Ansible 实践
本文首发于 Nebula Graph 公众号 NebulaGraphCommunity,Follow & 看大厂图数据库技术实践 背景 在 Nebula-Graph 的日常测试中,我们会经常在 ...
- 使用C#操作注册表
这节讲一下使用C#操作注册表. 首先来了解一下,什么是注册表,注册表是Windows中特有的一个东西,百度百科中对其解释如下:Windows注册表(Registry)实质上是一个庞大的数据库,它存储着 ...
- 再谈vbo
我们之前都是通过glNamedBufferData初始化buffer object,初始化的意思是为buffer object开辟显存空间,并填充数据: GLfloat position[] = { ...