一 字符编码

储备知识点:

  1.计算机系统分为三层:

    应用程序

    操作系统

    计算机硬件

  2.运行Python程序的三个步骤

    1.先启动python解释器

    2.再将python文件当做普通的文本文件读入内存

    3.解释执行读入内存的代码,开始识别语法

字符编码

  1.什么是字符编码

    字符编码表:人类的字符<------------>数字

    1Bytes=8bit

    1B=8bit  1字节等于8个二进制

    ASCII码:只能识别英文字符,1英文字符=8bit

      用8个二进制bit(比特位)表示一个英文字符

    GBK:能识别汉子与英文,1汉字=16bit,1英文字符=8bit

    Shift_JIS

    Euc-kr

    unicode:能够识别万国字符,1字符=2Bytes=16bit

      两大特点:

        1.能够兼容台万国字符

        2.与各个国家的字符编码都有映射关系

    utf-8:是Unicode的转换格式,1个英文字符=1Bytes   1汉字=3Bytes

    重点理论:

      1 编码与解码:

        字符----编码------>unicode的二进制--------->GBK的二进制

        GBK的二进制-----解码--->unicode的二进制----解码-->字符

      2 解决乱码问题的核心法则:

        字符用什么编码格式编码的,就应该用什么编码格式进行解码.

      3 python解释器默认的字符编码

        Python2:ASCII

        Python3:UTF-8

        通过文件头可以修改python解释器默认认识的字符编码

        在文件首行写:#coding:文件初存的时候用的字符编码

        针对python2解释器中定义字符串应该:

        对于python3解释即便时x="上"不加前缀也是存成unicode

        在Python3中

          x='上'#  '上'存成了unnicode

          unicode-------------encod---------->gbk

          res=x.encode('gbj') #res是gbk格式的二进制,称之为bytes类型

          gbk(bytes类型)------decode---------->Unicode

          y=res.decode('gbk') #y就unicode

    关于字符编码的操作:

        1 编写python文件,首行应该加文件头:#coding:文件存时用的编码

        2 用python2写程序,定义字符串应该加前缀u,如x=u'上'

        3 python3中的字符都是unicode编码,python3的字符串encode之后可以得到bytes类型

    2.为何字符要编码

      人类与计算机打交道用的都是人类的字符,而计算机无法识别人类的字符,只能识别二进制,

      所以必须将人类的字符编码成计算机能识别的二进制数字.

    3.如何用字符编码

#coding:utf-8
'''
1 什么是文件
文件是操作系统提供给用户/应用程序的一种虚拟单位,该虚拟单位直接映射的是硬盘空间

2 为何要处理文件
用户/应用程序直接操作文件(读/写)就被操作系统转换成具体的硬盘操作,从而实现
用户/应用程序将内存中的数据永久保存到硬盘中

3 如何用文件

'''
文件处理的三个步骤
f=open(r'c.txt',mode='r',encoding='utf-8') # 文件对象(应用程序的内存资源)------》操作系统打开的文件(操作系统的内存资源)
  print(f)
data=f.read()
f.close() # 向操作系统发送信号,让操作系统关闭打开的文件,从而回收操作系统的资源

上下文管理
with open(r'c.txt',mode='r',encoding='utf-8') as f,open(r'b.txt',mode='r',encoding='utf-8') as f1:
读写文件的操作
pass

文件的打开模式:r(默认的) w a
操作文件内容的模式:
t(默认的):操作文件内容都是以字符串为单位,会自动帮我们解码,必须指定encoding参数
b: 操作文件内容都是以Bytes(二进制)为单位,硬盘中存的时什么就取出什么,一定不能指定encoding参数
总结:t模式只能用于文件本文件,而b模式可以用于任意文件

r模式:只读模式,在文件不存在时则报错,如果文件存在文件指针跳到文件的开头
with open(r'c.txt',mode='rt',encoding='utf-8') as f:
print(f.read())
print(f.readable())
print(f.writable())
f.write('hello') # 只能读

data=f.read()
print(data,type(data))

with open(r'c.txt',mode='rb') as f:
data=f.read()
  print(data,type(data))
res=data.decode('utf-8')
  print(res)

with open(r'c.txt',mode='rt',encoding='utf-8') as f:

  line=f.readline()
  print(line,end='')
line1=f.readline()
print(line1,end='')
ine2 = f.readline()
print(line2,end='')

lines=f.readlines()
print(lines)
with open(r'c.txt',mode='rt',encoding='utf-8') as f:
line=f.readline()
print(line,end='')

循环读文件内容的方法:
with open(r'c.txt',mode='rt',encoding='utf-8') as f:
for line in f:
print(line,end='')

names=[]
passwords=[]
les = True
while les:
with open(r'db.txt',encoding='utf-8') as f:
name = input('请输入用户名>>:')
password = input('请输入密码>>:')
for line in f:
a,b=line.strip('\n').split(':')
if name==a and password==b:
print('登录成功')
les = None
break
else:
print('用户名或密码不正确')
names.append(a)
passwords.append(b)
print(names,passwords)

作业一:

les = True

while les:
  with open(r'db.txt',encoding='utf-8') as f:
    name = input('请输入用户名>>:')
    password = input('请输入密码>>:')
      for line in f:
        a,b=line.strip('\n').split(':')
        if name==a and password==b:
          print('登录成功')
          les = None
          break
        else:
          print('用户名或密码不正确')

python字符编码与文件打开的更多相关文章

  1. Python 字符编码及其文件操作

    本章节内容导航: 1.字符编码:人识别的语言与机器机器识别的语言转化的媒介. 2.字符与字节:字符占多少个字节,字符串转化 3.文件操作:操作硬盘中的一块区域:读写操作 注:浅拷贝与深拷贝 用法: d ...

  2. python字符编码和文件处理

    一.了解字符编码的知识储备 1.文本编辑器存取文件的原理(nodepad++,python,word) 打开编辑器就打开了启动了一个进程,是在内存中的,所以,用编辑器编写的内容也都是存放于内存中的,断 ...

  3. 06 Python字符编码与文件处理

    python垃圾回收机制: python中的垃圾回收机制是以引用计数为主,分代收集为辅,引用计数的缺陷是循环引用的问题,一个对象的引用数为0 ,那么这个对象就会被python虚拟机回收内存 字符编码 ...

  4. python字符编码与文件操作

    目录 字符编码 字符编码是什么 字符编码的发展史 字符编码实际应用 编码与解码 乱码问题 python解释器层面 文件操作 文件操作简介 文件的内置方法 文件的读写模式 文件的操作模式 作业 答案 第 ...

  5. python基础(三)----字符编码以及文件处理

      字符编码与文件处理 一.字符编码 由字符翻译成二进制数字的过程   字符--------(翻译过程)------->数字   这个过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之 ...

  6. Python之字符编码与文件操作

    目录 字符编码 Python2和Python3中字符串类型的差别 文件操作 文件操作的方式 文件内光标的移动 文件修改 字符编码 什么是字符编码? ''' 字符编码就是制定的一个将人类的语言的字符与二 ...

  7. python字符编码-文件操作

    字符编码 字符编码历史及发展 为什么有字符编码 ''' 原因:人们想要将数据存入计算机 计算机的能存储的信息都是二进制的数据 内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,所以计 ...

  8. python文件操作:字符编码与文件处理

    一.字符编码 二.文件处理 一.字符编码 储备知识点: 1. 计算机系统分为三层: 应用程序 操作系统 计算机硬件 2. 运行python程序的三个步骤 1. 先启动python解释器 2. 再将py ...

  9. python基础知识5---数据类型、字符编码、文件处理

    阅读目录 一 引子 二 数字 三 字符串 四 列表 五 元组 六 字典 七 集合 八 数据类型总结 九 运算符 十 字符编码 十一 文件处理 十二 作业   一 引子 1 什么是数据? x=10,10 ...

随机推荐

  1. 撒花!中文翻译仓库链接已加入 ML.NET 官方示例网站首页

    从2018年12月02日决定开始做ML.NET 示例中文版https://github.com/feiyun0112/machinelearning-samples.zh-cn,然后以每天一篇的速度进 ...

  2. Linux命令(一)

    需要用Xshell连接Linux时: 先在终端输入命令:service  sshd  start(开启ssh服务) 1.netstat -tnl:查看端口状态的命令(如 查看22端口) 2.servi ...

  3. Python_迭代器和生成器的复习_38

    迭代器和生成器 迭代器: 双下方法:很少直接调用的方法,一般情况下,是通过其他方法触发的 可迭代的协议——可迭代协议 含有__iter__ 的方法 ('__iter__' in dir(数据)) 可迭 ...

  4. Wannafly挑战赛28

    总结- A-开始觉得是找规律,最开始模拟当时我觉得如果L达到1e9的范围的话,岂不是要加1e9次,模拟也就没有认真写,现在想来,后面由于加的不再是1,而是我前面的值,这样相当了一个斐波那契的类型,而斐 ...

  5. from bs4 import BeautifulSoup 报错

    一: BeautifulSoup的安装: 下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/4.6/ 下载后,解压缩,然后 ...

  6. hdu3790 dijkstra+堆优化

    题目来源:http://acm.hdu.edu.cn/showproblem.php?pid=3790 分析:dijkstra没有优化的话,复杂度是n*n,优化后的复杂度是m*logm,n是顶点数,m ...

  7. 出题人的女装(牛客练习赛38题B) (概率+分式运算)

    链接:https://ac.nowcoder.com/acm/contest/358/B来源:牛客网 出题人的女装 时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 524288K,其他 ...

  8. iOS原生实现二维码拉近放大

    http://www.cocoachina.com/ios/20180416/23033.html 2018-04-16 15:34 编辑: yyuuzhu 分类:iOS开发 来源:程序鹅 8 300 ...

  9. python os模块详解

    一.Python os模块(Linux环境) 1.1 执行shell命令 os.system('cmd') 执行命令不保存结果 os.popen('command') 执行后返回结果,使用.read( ...

  10. 软件工程(FZU2015) 赛季得分榜,第五回合

    SE_FZU目录:1 2 3 4 5 6 7 8 9 10 11 12 13 积分规则 积分制: 作业为10分制,练习为3分制:alpha30分: 团队项目分=团队得分+个人贡献分 个人贡献分: 个人 ...