day 08文件与字符编码
ASCII 一个字符占一个字节
GBK 中文使用两个字节,英文使用1个字节,使用开头一个比特位标识是英文还是中文
unicode:支持任何国家的语言,全部字符都是使用两个字节
utf-8 一个英文占用一个字节, 中文占用3个字节
encode :就是将unicode--------->翻译--------->某种指定格式的二进制如utf-8
decode:将某种指定格式的二进制------>翻译------->unicode
修改文件:
因为文件是存储在硬盘上面的无法直接进行修改,必须先将硬盘里面的内容完全读出来,然后再讲修改后的文件写入
两种方式:
1.先将所有的文件全部读出来,然后将修改后的文件一次性再全部写回文件 缺点:过多的占用内存
2.先将文件内容读出一行,修改完成后.里面写入新的文件当中 缺点:频繁的I/0操作
day 08文件与字符编码的更多相关文章
- linux下改变文件的字符编码
		首先确定文件的原始字符编码: $ file -bi test.txt 然后用 iconv 转换字符编码 $ iconv -f from-encoding -t to-encoding file > ... 
- Gnu Linux下文件的字符编码及转换工具
		/********************************************************************* * Author : Samson * Date ... 
- eclipse设置新建jsp文件默认字符编码为utf-8
		在使用Eclipse开发中,编码默认是ISO-8859-1,不支持中文.这样我们每次新建文件都要手动修改编码,非常麻烦.其实我们可以设置文件默认编码,今后再新建文件时就不用修改编码了. 1.打开Ecl ... 
- python学习笔记(2)--列表、元组、字符串、字典、集合、文件、字符编码
		本节内容 列表.元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1.列表和元组的操作 列表是我们以后最长用的数据类型之一,通过列表可以最方便的对数据实现最方便的存储.修改等操作 定 ... 
- Day2 - Python基础2 列表、字符串、字典、集合、文件、字符编码
		本节内容 列表.元组操作 数字操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 ... 
- python基础之    列表、元组操作     字符串操作     字典操作     集合操作     文件操作     字符编码与转码
		本节内容 列表.元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 ... 
- Python 3 文件和字符编码
		一.文件: 打开文件的模式有: r,只读模式(默认). w,只写模式. 不可读,不存在则创建:存在则删除内容 a,追加模式. 可读,不存在则创建:存在则只追加内容 "+"表示可以 ... 
- python 读写文件和设置文件的字符编码
		一. python打开文件代码如下: f = open("d:\test.txt", "w") 说明:第一个参数是文件名称,包括路径:第二个参数是打开的模式mo ... 
- java自动探测文件的字符编码
		Mozilla有一个C++版的自动字符集探测算法代码,然后sourceforge上有人将其改成java版的~~ 主页:http://jchardet.sourceforge.net/ jchardet ... 
随机推荐
- Docker run命令参数整理
			Usage: docker run [OPTIONS] IMAGE [COMMAND] [ARG...] -d, --detach=false 指定容器运行于前台还是后台,默认为false -i, - ... 
- sqlalchemy orm介绍
			ORM介绍 简解:用户会使用ORM时会直接访问对象,对象在通过ORM与数据库进行交互,不需要用户操作sql. 详解:orm英文全称object relational mapping,就是对象映射关系程 ... 
- rds下载备份集
			python版本[testuser@localhost tmp]$ python -VPython 2.7.5 需要提前安装RDS[root@localhost ~]# yum -y install ... 
- luoguP1281 书的复制 DP,贪心
			luoguP1281 书的复制 链接 https://www.luogu.org/problemnew/show/P1281 思路 简单dp,输出方案. 很明显dp记录路径对不对? 恭喜你死了. 求出 ... 
- parquet 简介
			原文 Parquet 列式存储格式 面向分析型业务的列式存储格式 由 Twitter 和 Cloudera 合作开发,2015 年 5 月从 Apache 的孵化器里毕业成为 Apache 顶级项目 ... 
- Centos7初始化脚本
			今天分享一个自己写的一个初始化的小脚本. 编写初始化系统要考虑到系统的版本问题,现在用的比较多的就是centos6和centos7,所以首先要判断一下系统的版本. cat /etc/redhat-re ... 
- 【Core】.NET Core中读取App.config配置文件
			1.项目中添加App.config文件 因为.NET Core的项目本质是控制台应用,所以ConfigurationManager的API会去默认读取app.config配置文件,而不是web.con ... 
- Web开发中button与submit区别
			submit是button的一个特例,也是button的一种,它把提交这个动作自动集成了. 如果表单在点击提交按钮后需要用JS进行处理(包括输入验证)后再提交的话,通常都必须把submit改成butt ... 
- windows2012安装
			windows server 2012 r2 安装无法找到install.wim 错误代码0x80070026,以及制作U启动盘决解ISO文件超过5G大小限制的解决方案关于在服务器上安装windows ... 
- Python自学:第三章 访问列表元素
			#输出并首字母大写 bicycles = ['trek','cannondale','redline','specialized'] print(bicycles[0].title()) 输出为: T ... 
