【情感分析必备】python文件读写:codecs
codecs在读取文件时,发生错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte
中文切换编码:gbk,正常解决。

但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。
这时候,需要加个参数, errors="ignore"
# 读文件:含特殊字符
import codecs
f = codecs.open('20.txt', 'rb',encoding='gbk', errors="ignore")
# 默认编码utf-8,中文是gbk
content = f.readline()
f.close()
print('in:',content)

参考网站:https://www.cnblogs.com/always-fight/p/10304806.html
【情感分析必备】python文件读写:codecs的更多相关文章
- python文件读写及形式转化和CGI的简单应用
		
一丶python文件读写学习笔记 open() 将会返回一个 file 对象,基本语法格式如下: open(filename, mode) filename:包含了你要访问的文件名称的字符串值. mo ...
 - python 文件读写操作(24)
		
以前的代码都是直接将数据输出到控制台,实际上我们也可以通过读/写文件的方式读取/输出到磁盘文件中,文件读写简称I/O操作.文件I/O操作一共分为四部分:打开(open)/读取(read)/写入(wri ...
 - python 文件读写方式
		
一.普通文件读写方式 1.读取文件信息: with open('/path/to/file', 'r') as f: content = f.read() 2.写入文件中: with open('/U ...
 - Python 文件读写,条件循环(三次登录锁定账号实例)
		
通过文件读写,条件循环相关语法,实现三次登录失败则锁定该账号的功能 需求一 """需求描述: 1.输入正确账号,密码,退出程序 2.登录失败,重新输入账号密码 3.同一账 ...
 - 【学习】python文件读写,用with open as的好处,非常好【转载】
		
原文链接:http://www.cnblogs.com/ymjyqsx/p/6554817.html 备注:博主还有很多值得学习的笔记,遇到问题可以拜读,非常感谢博主的总结 读写文件是最常见的IO操作 ...
 - python文件读写,以后就用with open语句
		
读写文件是最常见的IO操作.Python内置了读写文件的函数,用法和C是兼容的. 读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘, ...
 - Python文件读写(open(),close(),with open() as f...)
		
Python内置了读写文件的函数,用法和C是兼容的.本节介绍内容大致有:文件的打开/关闭.文件对象.文件的读写等. 本章节仅示例介绍 TXT 类型文档的读写,也就是最基础的文件读写,也需要注意编码问题 ...
 - Python文件读写、StringIO和BytesIO
		
1 IO的含义 在计算机中,IO是Input/Output的简写,也就是输入和输出. 由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘.网络等,就 ...
 - python文件读写小结
		
读文件 打开一个文件用open()方法(open()返回一个文件对象,它是可迭代的): >>> f = open('test.txt', 'r') r表示是文本文件,rb是二进制文件 ...
 - Python文件读写及网站显示
		
一.关于文件读写的笔记 (一) 文件概述 文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容 文件都是按照2进制进行存储的,但在表现形式上有2种:文本文件和二进制文件. 1. 文本文件 文本 ...
 
随机推荐
- Waiting for another flutter command to release the startup lock...
			
2019独角兽企业重金招聘Python工程师标准>>> rm ./flutter/bin/cache/lockfile info from 转载于:https://my.oschin ...
 - redhat7.3 dns服务器配置
			
1.基本配置 systemctl stop firewalld.service systemctl disable firewalld.service setenforce 0 nmcli conne ...
 - 10倍处理能力 阿里云推云上首个支持12层4K非编NAS产品
			
5月23日,阿里云在2017云栖大会·成都峰会上正式推出了云上首个支持广电级非编的文件存储产品------NAS Plus,作为阿里云文件存储NAS的升级款,NAS Plus提供高达200Gbps的吞 ...
 - 演示:配置日志发送到syslog日志服务器
			
演示目标:配置网络环境中的交换机和路由器将日志发送到syslog日志服务器. 演示环境:如下图10.54所示的演示环境. 演示背景:要求部署网络中的syslog服务器,集中的收集交换机S1和路由器R1 ...
 - 基于HTML Canvas实现“指纹识别”技术
			
https://browserleaks.com/canvas 说明所谓指纹识别是指为每个设备标识唯一标识符(以下简称UUID).诸如移动原生的APP都可以通过调用相关设备API来获取相应的UUID. ...
 - 信息奥赛一本通1486: CH 6202 黑暗城堡 最短路径生成树计数
			
1486:黑暗城堡 [题目描述] 知道黑暗城堡有 N 个房间,M 条可以制造的双向通道,以及每条通道的长度. 城堡是树形的并且满足下面的条件: 设 Di为如果所有的通道都被修建,第 i 号房间与第 1 ...
 - 更安全的rm命令,保护重要数据
			
更安全的rm命令,保护重要数据 网上流传的安全的rm,几乎都是提供一个rm的"垃圾"回收站,在服务器环境上来说,这实非良方. 我想,提供一个安全的rm去保护一些重要的文件或目录不被 ...
 - nginx反向代理做负载均衡以及使用redis实现session共享配置详解
			
1.为什么要用nginx做负载均衡? 首先我们要知道用单机tomcat做的网站,比较理想的状态下能够承受的并发访问在150到200, 按照并发访问量占总用户数的5%到10%技术,单点tomcat的用户 ...
 - 【mybatis】IF判断的坑
			
http://cheng-xinwei.iteye.com/blog/2008200 最近在项目使用mybatis中碰到个问题 <if test="type=='y'"> ...
 - .NET分离exe和dll在不同的目录让你的程序更整洁
			
1.引言 在一个项目开发中一般都是把引用的dll放在根目录下,随着项目的日益增大,根目录下的dll文件就会越来越多,合理规划这些dll的存放地址,可以使整个项目更加的规范与美观.这篇文章就为大家介绍关 ...
 
			
		
这时候,需要加个参数, errors="ignore"