Python读取xml报错解析--ExpatError: not well-formed (invalid token)

xml文件内容如代码所示存入的名字为login.xml：

<?xml version="1.0" encoding="utf-8"?>

<info>

   <explain>126</explain>

      <url>http://www.126.com</url>

      <null username="" password="">请先输入您的邮箱帐号</null>

      <pawd_null username="testingwtb" password=""></pawd_null>

      <user_null username="" password="a123456">

      </user_null>

      <error username="xxx" password="xxx"></error>

</info>

Python源代码代码本身是没有错误的：

#coding =utf-8

import xml.dom.minidom

dom=xml.dom.minidom.parse('D:\Python27\lianxidanma\login.xml')

root = dom.documentElement

logins=root.getElementsByTagName('null')

username=logins[0].getAttribute("username")

password=logins[0].getAttribute("password")

prompt_info = logins[0].firstChild.data

print username

print prompt_info

使用xml.dom.mindom库解析xml文件时，报如下错误：

Traceback (most recent call last):

  File "D:\Python27\lianxidanma\xml11.py", line 4, in <module>

    dom=xml.dom.minidom.parse('D:\Python27\lianxidanma\login.xml')

  File "D:\Python27\lib\xml\dom\minidom.py", line 1918, in parse

    return expatbuilder.parse(file)

  File "D:\Python27\lib\xml\dom\expatbuilder.py", line 924, in parse

    result = builder.parseFile(fp)

  File "D:\Python27\lib\xml\dom\expatbuilder.py", line 207, in parseFile

    parser.Parse(buffer, 0)

ExpatError: not well-formed (invalid token): line 5, column 36

其实报这个错误主要还是“转码”的问题，如果xml文件中没有中文，自然能够输入所需要的数据，但是现在xml文件中有中文。

一般情况我们在做自动化测试的时候，习惯用txt来编辑xml文件进行数据保存，但是在用txt编辑完xml文件后，都习惯性的直接点击保存，默认保存的编码方式是ANSI

问题就出在编码方式，如果我们用UTF-8的编码方式保存后，重新执行脚本，那么程序执行成功，正确输出中文：

Python 2.7.9 (default, Dec 10 2014, 12:28:03) [MSC v.1500 64 bit (AMD64)] on win32

Type "copyright", "credits" or "license()" for more information.

>>> ================================ RESTART ================================

>>> 

Traceback (most recent call last):

  File "D:\Python27\lianxidanma\xml11.py", line 4, in <module>

    dom=xml.dom.minidom.parse('D:\Python27\lianxidanma\login.xml')

  File "D:\Python27\lib\xml\dom\minidom.py", line 1918, in parse

    return expatbuilder.parse(file)

  File "D:\Python27\lib\xml\dom\expatbuilder.py", line 924, in parse

    result = builder.parseFile(fp)

  File "D:\Python27\lib\xml\dom\expatbuilder.py", line 207, in parseFile

    parser.Parse(buffer, 0)

ExpatError: not well-formed (invalid token): line 5, column 36

>>> ================================ RESTART ================================

>>> 

请先输入您的邮箱帐号

>>>

Python读取xml报错解析--ExpatError: not well-formed (invalid token)的更多相关文章

【python】python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte ...
DataSet 读取xml 报错有非法字符
private void Bind() { string strLogPath = ConfigurationSettings.AppSettings["LOG_PATH"].To ...
【Python】Python读取文件报错：UnicodeDecodeError: 'gbk' codec can't decode byte 0x99 in position 20: illegal multibyte sequence
环境描述 text.txt 今天的天气不错是个皻的选择读取文件的代码 #!/usr/bin/python #-*- coding:UTF-8 -*- f = open(r'D:\Python\Py ...
python读取文件报错：pandas.errors.ParserError: iterator should return strings, not bytes (did you open the file in text mode?)
python 读取csv文件报错问题 import csv with open('E:/Selenium2script/DDT模块/test.csv','rb') as f: readers = cs ...
web.xml报错：cvc-complex-type.2.4.a: Invalid content was found starting with element 'async-supported'. One of '{"http://java.sun.com/xml/ns/javaee":init-param}' is expected.
在写xml的时候又一次总是报cvc-complex-type.2.4.a: Invalid content was found starting with element 错误,还出现小红叉,在网上找 ...
Java使用dom4j读取xml时报错：org.dom4j.DocumentException: Error on line 2 of document : Invalid byte 2 of 2-byte UTF-8 sequence. Nested exception: Invalid byte 2 of 2-byte UTF-8 sequence
1.Java使用dom4j读取xml时报错: org.dom4j.DocumentException: Error on line 2 of document : Invalid byte 2 of ...
（转）解决dubbox-demo-provider.xml报错的问题：提示Failed to read schema document
背景:在eclipse项目中,经常会遇到xml文件提示找不到.xsd文件的情况.很有必要弄清xsd文件的加载过程! 1 解决过程 dubbo-demo-provider导入eclipse后dubbox ...
java -- SSM配置完成后，能访问jsp文件不能访问html文件，报错解析
SSM配置完成后,能访问jsp文件不能访问html文件,报错解析在确保路径没有任何问题的,情况下,相同的页面,jsp能够正常访问,html却不能正常访问(404). 解决方法: 在web.xml中添 ...
python读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

随机推荐

在linux下安装Python：
# 下载最新版本 cd /usr/local/src/ sudo wget http://www.python.org/ftp/python/3.3.2/Python-3.3.2.tar.bz2 su ...
linux中tar命令用法
把常用的tar解压命令总结下,当作备忘: tar -c: 建立压缩档案 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原压缩包中的文件这五个是独立的命令,压缩解压都要用到其 ...
剑指Offer 斐波那契数列
题目描述大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项. n<=39 思路: 不考虑递归用递推的思路 AC代码: class Solution { public ...
如何预览github中的html页面
在github里面的文件路径是https://github.com/gavin125/Sass-test/blob/master/html/index.html 那么我们需要在这个地址前面加上http ...
Qt 官方一键动态发布技能
苦找了好几天动态库,程序可以运行了,结果没有图标还是少了运行库很苦恼,发现Qt 官方有一键动态发布功能感觉自己萌萌的,来自qt吧亲测可用. 集成开发环境 QtCreator 目前生成图形界面程序 ex ...
Python自动化之sqlalchemy（修改和查询）
修改 my_user = Session.query(User).filter_by(name="alex").first() my_user.name = "Alex ...
jQuery调用后台方法
前台: <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="Default.as ...
jsp自定义标签（时间格式化包括Long转时间）
1.jsp自带标签的格式化: jstl fmt 函数大全:主要针对格式化功能 Tags fmt:requestEncoding fmt:setLocale fmt:timeZone fmt:set ...
Call to undefined function mysql_connnect()
PHP Fatal error: Call to undefined function mysql_connnect() in /var/www/html/mysqltest.php on line ...
算法手记之数据结构(线段树详解)(POJ 3468)
依然延续第一篇读书笔记,这一篇是基于<ACM/ICPC 算法训练教程>上关于线段树的讲解的总结和修改(这本书在线段树这里Error非常多),但是总体来说这本书关于具体算法的讲解和案例都是不 ...

Python读取xml报错解析--ExpatError: not well-formed (invalid token)

Python读取xml报错解析--ExpatError: not well-formed (invalid token)的更多相关文章

随机推荐

热门专题