xml解析错误:Invalid byte 2 of 2-byte UTF-8 sequence

在做接口解析时候出现的错误:Invalid byte 2 of 2-byte UTF-8 sequence. Nested exception: Invalid byte 2 of 2-byte UTF-8 sequence.



非常明显是在读取XML文件时候出现的编码问题。

在測试过程中发现。主要原因是xml文件里声明的编码与xml文件本身保存时的编码不一致。



如今解决的办法就有几个,主要说我測试过的两个方。

假设你是直接以文件的形式读取 能够更改XML文件里的 UTF-8编码 改为 GBK或GB2312 .

另一种可能是 你直接以URL 通过网络地址获取InputStream流形式读取 在转换成Document对象。这样的方法的解决的方法是先down 下来保存在本地。实现比較简单 用个OutputStream流写到你想保存的文件夹就可以。再解析down下来的文件 当中在 SAXReader saxReader = new SAXReader();

正常写法:

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true,指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

 

  SAXBuilder sax = new SAXBuilder();

  Document doc = sax.build(httpConn.getInputStream());

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

return impowerDeviceVo;

}

改动方法例如以下:

造一个暂时文件保存所定的编码报文,然后读取,读取解析后关闭流,再删除文件,否则会报文件读取多误 read error

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true。指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

InputStream inputStream = httpConn.getInputStream();

  String fileName = "tempxml.xml";

 

  // 保存文件

  File f = new File(fileName);

  if (!f.exists())

  {

   f.createNewFile();

  }

  String xmlContent = readXmlStream(inputStream);

  System.out.println("进入-----------"+xmlContent);

  FileOutputStream fileOutputStream = new FileOutputStream(f);

  fileOutputStream.write(xmlContent.getBytes("utf-8"));

  fileOutputStream.close();

  // 打开文件

  f = new File(fileName);

  FileInputStream fileInputStream = new FileInputStream(f);

 

  SAXBuilder sax = new SAXBuilder();

//  Document doc = sax.build(httpConn.getInputStream());

  Document doc = sax.build(fileInputStream);

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

  fileInputStream.close();

  f.delete();

return impowerDeviceVo;

}

xml:Invalid byte 2 of 2-byte UTF-8 sequence的更多相关文章

  1. CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法

    CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法: 基本可以确定是Podfile中的内容编码有 ...

  2. Python3 使用requests请求,解码时出错:'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

    requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...

  3. 使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in position 78: invalid continuation byte

    使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in pos ...

  4. 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in position 38: invalid continuation by

    1.windows中安装虚拟环境virtualenv时, 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in po ...

  5. python 读取文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence

    UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence p ...

  6. Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence

    Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal mul ...

  7. python csv文件打开错误:_csv.Error: line contains NULL byte

    当python读取文件出现_csv.Error: line contains NULL byte时, # -*- coding:utf-8 -*- import csv with open(r'E:\ ...

  8. [原创]java WEB学习笔记81:Hibernate学习之路--- 对象关系映射文件(.hbm.xml):hibernate-mapping 节点,class节点,id节点(主键生成策略),property节点,在hibernate 中 java类型 与sql类型之间的对应关系,Java 时间和日期类型的映射,Java 大对象类型 的 映射 (了解),映射组成关系

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  9. 【转】java中byte, int的转换, byte String转换

    原文网址:http://freewind886.blog.163.com/blog/static/661924642011810236100/ 最近在做些与编解码相关的事情,又遇到了byte和int的 ...

随机推荐

  1. hdu 1429 胜利大逃亡(延续)(BFS+比特压缩)

    #include <stdio.h> #include <string.h> #include <iostream> #include <algorithm& ...

  2. [Unity3D]脚本中Start()和Awake()的差别

    Unity3D刚開始学习的人常常把Awake和Start混淆. 简单说明一下,Awake在MonoBehavior创建后就立马调用,Start将在MonoBehavior创建后在该帧Update之前. ...

  3. jdk阅读xml文件

    前言 你需要阅读的时间来写一个通用组件xml文件,但考虑到组件分布更容易,这样一来在第三方小引用jar包.因此,直接jdk内建的xml分析方法.可能都没有第三发的组件强大. 导入的文件: import ...

  4. 菜鸟版JAVA设计模式-从抽象与实现说桥接模式

    桥接模式,初学的时候事实上非常不理解为什么要把这个模式命名为桥接模式,脑海里突然联想到.事实上我学习是一件比較痛苦的事情,由于我必需要知道来龙去脉才干学的进去,所以,非常快我就对这个命名产生了兴趣,桥 ...

  5. Linux平台下裸设备的绑定:

    Linux平台下裸设备的绑定: 运用RAW绑定 方法一 raw的配置(1) [root@qs-dmm-rh2 mapper]# cat /etc/rc.local #!/bin/sh # # This ...

  6. 【Linux探索之旅】第一部分第三课:测试并安装Ubuntu

    内容简介 1.第一部分第三课:测试并安装Ubuntu 2.第一部分第四课预告:磁盘分区 测试并安装Ubuntu 大家好,经过前两个比较偏理论(是否想起了带着瓜皮帽,手拿折扇的老学究,或者腐儒)的课程, ...

  7. HDU2516-取石子游戏

    取石子游戏 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Subm ...

  8. Oracle Applications Multiple Organizations Access Control for Custom Code

    档 ID 420787.1 White Paper Oracle Applications Multiple Organizations Access Control for Custom Code ...

  9. web压力测试-pylot

    我已经写在使用前Web Bench做压力測试.http://blog.csdn.net/jacson_bai/article/details/41143713 但这个測试,測试结果非常好.缺点就是,无 ...

  10. 第十二章——SQLServer统计信息(3)——发现过期统计信息并处理

    原文:第十二章--SQLServer统计信息(3)--发现过期统计信息并处理 前言: 统计信息是关于谓词中的数据分布的主要信息源,如果不知道具体的数据分布,优化器不能获得预估的数据集,从而不能统计需要 ...