xml解析错误:Invalid byte 2 of 2-byte UTF-8 sequence

在做接口解析时候出现的错误:Invalid byte 2 of 2-byte UTF-8 sequence. Nested exception: Invalid byte 2 of 2-byte UTF-8 sequence.



非常明显是在读取XML文件时候出现的编码问题。

在測试过程中发现。主要原因是xml文件里声明的编码与xml文件本身保存时的编码不一致。



如今解决的办法就有几个,主要说我測试过的两个方。

假设你是直接以文件的形式读取 能够更改XML文件里的 UTF-8编码 改为 GBK或GB2312 .

另一种可能是 你直接以URL 通过网络地址获取InputStream流形式读取 在转换成Document对象。这样的方法的解决的方法是先down 下来保存在本地。实现比較简单 用个OutputStream流写到你想保存的文件夹就可以。再解析down下来的文件 当中在 SAXReader saxReader = new SAXReader();

正常写法:

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true,指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

 

  SAXBuilder sax = new SAXBuilder();

  Document doc = sax.build(httpConn.getInputStream());

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

return impowerDeviceVo;

}

改动方法例如以下:

造一个暂时文件保存所定的编码报文,然后读取,读取解析后关闭流,再删除文件,否则会报文件读取多误 read error

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true。指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

InputStream inputStream = httpConn.getInputStream();

  String fileName = "tempxml.xml";

 

  // 保存文件

  File f = new File(fileName);

  if (!f.exists())

  {

   f.createNewFile();

  }

  String xmlContent = readXmlStream(inputStream);

  System.out.println("进入-----------"+xmlContent);

  FileOutputStream fileOutputStream = new FileOutputStream(f);

  fileOutputStream.write(xmlContent.getBytes("utf-8"));

  fileOutputStream.close();

  // 打开文件

  f = new File(fileName);

  FileInputStream fileInputStream = new FileInputStream(f);

 

  SAXBuilder sax = new SAXBuilder();

//  Document doc = sax.build(httpConn.getInputStream());

  Document doc = sax.build(fileInputStream);

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

  fileInputStream.close();

  f.delete();

return impowerDeviceVo;

}

xml:Invalid byte 2 of 2-byte UTF-8 sequence的更多相关文章

  1. CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法

    CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法: 基本可以确定是Podfile中的内容编码有 ...

  2. Python3 使用requests请求,解码时出错:'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

    requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...

  3. 使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in position 78: invalid continuation byte

    使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in pos ...

  4. 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in position 38: invalid continuation by

    1.windows中安装虚拟环境virtualenv时, 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in po ...

  5. python 读取文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence

    UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence p ...

  6. Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence

    Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal mul ...

  7. python csv文件打开错误:_csv.Error: line contains NULL byte

    当python读取文件出现_csv.Error: line contains NULL byte时, # -*- coding:utf-8 -*- import csv with open(r'E:\ ...

  8. [原创]java WEB学习笔记81:Hibernate学习之路--- 对象关系映射文件(.hbm.xml):hibernate-mapping 节点,class节点,id节点(主键生成策略),property节点,在hibernate 中 java类型 与sql类型之间的对应关系,Java 时间和日期类型的映射,Java 大对象类型 的 映射 (了解),映射组成关系

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  9. 【转】java中byte, int的转换, byte String转换

    原文网址:http://freewind886.blog.163.com/blog/static/661924642011810236100/ 最近在做些与编解码相关的事情,又遇到了byte和int的 ...

随机推荐

  1. js实现文字逐个显示

    先把代码摆上了吧: <!DOCTYPE html> <html lang="en" xmlns="http://www.w3.org/1999/xhtm ...

  2. iOS的图表显示的实现

    在app通常有家居展览的照片,显示广告.或者头条新闻.通常网易新闻client 如图,红框框的位置就是一个典型的图展, 熟悉iOS的人肯定知道,这个是个UIScrollview,里面加几张图片就可以实 ...

  3. RH033读书笔记(12)-Lab 13 Finding and Processing Files

    Sequence 1: Using find Scenario: Log in as user student. Devise and execute a find command that prod ...

  4. android:强大的图像下载和缓存库Picasso

    1.Picasso一个简短的引论 Picasso它是Square该公司生产的一个强大的图像下载并缓存画廊.官方网站:http://square.github.io/picasso/ 仅仅须要一句代码就 ...

  5. S2SH新手框架结构的准备工作只需要导入这些文件

    实习北京最近一直在某公司.时间很冲突,总想着有事找东西坐,思想,做事先成套我吧 一套完整的东西想好主题,术去实现了,在学校尽管说是学了J2EE,可是确实没学到东西,Struts2+Hibernate不 ...

  6. 分散式-ubuntu12.04安装spark-1.0.0

    1. 安装文档: http://spark.apache.org/docs/latest/spark-standalone.html 2. web UI: master's web UI, which ...

  7. C/C++综合測试题(三)

    又刷了一套题 这些题都是百度.阿里巴巴.腾讯.网易.新浪等公司的面试原题,有一定的难度.只是确实相当有水平,能够通过做题来查漏补缺. 1.补充以下函数代码: 假设两段内存重叠,用memcpy函数可能会 ...

  8. MyEclipse—怎样在MyEclipse中创建servlet3.0

    servlet3.0随着Java EE6规范一起公布,那么怎样在MyEclipse中创建3.0版的servlet呢? 1.启动MyEclipse.获得下图: 2.点击上图"File" ...

  9. Html5 拖放上传图片

    <!DOCTYPE HTML> <html> <head> <meta charset="utf-8"> <title> ...

  10. Andrid 多线程下载

    本文转自:http://www.2cto.com/kf/201205/130969.html 本文将介绍在android平台下如何实现多线程下载,大家都知道,android平台使用java做为开发语言 ...