Python十六进制转码问题
使用Python的decode函数转码十六进制的字符串时,会出现UnicodeDecodeError: 'utf8' codec can't decode byte 0xba in position 3: invalid start byte的错误!
例如我需要转码十六进制字符串 '\xe8\xa7\xa3\xe7\xba\xa6\xe6\x88\x90\xe5\x8a\x9f' ,使用过以下几种方法,不是出错就是乱码
a = '\xe8\xa7\xa3\xe7\xba\xa6\xe6\x88\x90\xe5\x8a\x9f'
1. s1 = a.decode('utf-8') 2. s2 = a.decode('unicode_escape') 3. c = a.encode('raw_unicode_escape')
b = repr(c)
s3 = unicode(eval(b), "gbk").encode('utf8')
我们看看decode函数的源码,可以看到有如下注释:

decode函数的第二个参数默认是strict,我们只要把它改成ignore就可以了
ignore:忽视无法解码的字符
replace:替换无法解码的字符
s = a.decode('utf-8', 'ignore')
或者
s = a.decode("string_escape")
完美解决问题
Python十六进制转码问题的更多相关文章
- 【转】python:让源码更安全之将py编译成so
		python:让源码更安全之将py编译成so 应用场景 Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,使用其开发产品快速高效. python的解释特性是将py编译为独有的二 ... 
- Python 二维码制作
		Python 二维码制作 先介绍python 二维码制作的第三方库 QRCode .MyQR QRCode 生成这个二维码只用三行 import qrcode img = qrcode.make ... 
- 《python解释器源码剖析》第11章--python虚拟机中的控制流
		11.0 序 在上一章中,我们剖析了python虚拟机中的一般表达式的实现.在剖析一遍表达式是我们的流程都是从上往下顺序执行的,在执行的过程中没有任何变化.但是显然这是不够的,因为怎么能没有流程控制呢 ... 
- 《python解释器源码剖析》第9章--python虚拟机框架
		9.0 序 下面我们就来剖析python运行字节码的原理,我们知道python虚拟机是python的核心,在源代码被编译成字节码序列之后,就将有python的虚拟机接手整个工作.python虚拟机会从 ... 
- 《python解释器源码剖析》第8章--python的字节码与pyc文件
		8.0 序 我们日常会写各种各样的python脚本,在运行的时候只需要输入python xxx.py程序就执行了.那么问题就来了,一个py文件是如何被python变成一系列的机器指令并执行的呢? 8. ... 
- 《python解释器源码剖析》第0章--python的架构与编译python
		本系列是以陈儒先生的<python源码剖析>为学习素材,所记录的学习内容.不同的是陈儒先生的<python源码剖析>所剖析的是python2.5,本系列对应的是python3. ... 
- functools.singledispatchmethod(Python 3.8) | 码农网 https://www.codercto.com/a/83245.html
		functools.singledispatchmethod(Python 3.8) | 码农网 https://www.codercto.com/a/83245.html 
- Python十六进制与字符串的转换
		电脑上装了Python2.7和3.3两个版本,平时运行程序包括在Eclipse里面调试都会使用2.7,但是由于某些原因在cmd命令行中输入python得到的解释器则是3.3, 一直没对此做处理,因为这 ... 
- python:让源码更安全之将py编译成so
		应用场景 Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,使用其开发产品快速高效. python的解释特性是将py编译为独有的二进制编码pyc文件,然后对pyc中的指令进行解 ... 
随机推荐
- spring源码-bean之加载-2
			一.前面说了bean的容器初始化,后面当然是说bean的加载.这里还是不讲解ApplicationContext的bean的加载过程,还是通过最基础的XmlBeanFactory来进行讲解,主要是熟悉 ... 
- quartz 核心概念
			一.quartz 核心概念 1.scheduler是一个计划调度器容器,容器里面可以盛放众多的JobDetail和trigger,当容器启动后,里面的每个JobDetail都会根据trigger按部就 ... 
- Linux命令非常全
			最近都在和Linux打交道,感觉还不错.这也是很多人喜欢linux的原因,比较短小但却功能强大.我将我了解到的命令列举一下,仅供大家参考: 系统信息 arch 显示机器的处理器架构(1) uname ... 
- java Arrays.asList
			List<String> list = Arrays.asList("A B C D E F G H I J K L ".split(" ")); ... 
- Appium的环境搭建和配置
			Appium的环境搭建和配置 一.安装Nodejs 下载nodejs安装包(https://nodejs.org/en/download/)安装 下载后,双击安装文件,按提示来安装. 测试安装是否成功 ... 
- 交换学生 (Foreign Exchange,UVa10763)
			题目描述: 解题思路: 开一个数组,读入一次交换两个数,如果最后数组不变,即符合匹配 #include<iostream> #include<cstdio> #include& ... 
- 【转】跨平台移动端开发框架NativeScript 发布正式版本
			原文:http://news.cnblogs.com/n/520865/ Nativescript 项目地址:http://www.telerik.com/nativescript “一次编码,处处运 ... 
- 词嵌入向量WordEmbedding
			词嵌入向量WordEmbedding的原理和生成方法 WordEmbedding 词嵌入向量(WordEmbedding)是NLP里面一个重要的概念,我们可以利用WordEmbedding将一个单 ... 
- UVa 1583 - Digit Generator 解题报告 - C语言
			1.题目大意 如果a加上a的各个数字之和得到b,则说a是b的生成元.给出n其中$1\le n\le 100000$,求其最小生成元,若没有解则输出0. 2.思路 使用打表的方法打出各个数字a对应的b, ... 
- Linux内核设计笔记14——块I/O层
			块I/O层 基本概念 系统中可以随机访问固定大小数据片的硬件设备称做块设备,这些固定大小的数据片称之为块.还有一种基本的设备称之为字符设备,其需要按照顺序访问,比如键盘. 扇区:块设备中最小的寻址单元 ... 
