day08（字符编码，字符与字节，文件操作）

一，复习

'''

 类型转换


    1.数字类型：int() | bool() | float()

    2.str与int： int('10') | int('-10') | int('0') | float('-.5') | float('3.14') | str(数字)

    3.重点 - str与list：


   　　 'abc' => ['a', 'b', 'c']: list('abc') | ''.join(['a', 'b', 'c'])

   　　 'abc|def|xyz' => ['abc', 'def', 'xyz']: s.split('|') | '|'.join(ls)

    4.list、set、tuple：类型()

    5.list与dict：


    　　a=1&b=2&c=3 <=> [('a', 1), ('b', 2), ('c', 3)] <=> {'a': 1, 'b': 2, 'c': 3}

    　　dic = {}

   　　 for k, v in [('a', 1), ('b', 2), ('c', 3)]:

        　　dic[k] = v

   　　 ls = []

    　　for k, v in {'a': 1, 'b': 2, 'c': 3}.items():

        　　ls.appen((k, v))

    6.可以通过字典构建任意数据的映射关系：


   　　 type_map = {

       　　 1: '壹',

        　　'壹': 1,

       　　 'owen'：(1, 88888),

       　　 'add': add  # add是功能(函数)

   　　 }

字符编码：

    编码表：人能识别的符号与机器能识别的符号(01组成的二进制码)映射关系

    py2：ASCII，常用ASCII表只有英文、数字、英文符号与与机器能识别的符号的对应关系

    py3：utf-8，是unicode编码表的一种实现方式，采用变长存储数据，字母数字简单符号1个字节，中文3~6字节

    utf-8: 变长，在英文数字较多时，更节省空间，用于传输，cpu与硬盘中采用的编码格式

    utf-16: 定长，英文数字汉字都是采用2个字节，读存效率高，内存中采用的编码格式

    gbk => utf-8: 转码

    　　普通字符串 => 二进制字符串：编码，目的是用于传输数据  'abc'.encode('utf-8')

   　　 二进制字符串 => 普通字符串：解码，目的是用于显示数据  b'abc'.decode('utf-8')

　例子：

# ascii与字符的相互转换
print(10)
print(0B1010)  　　# 二进制 0b
print(0o12) ·　　  # 八进制 0o
print(0xa)  　　　　# 十六进制 0x

# 将数字转化为字符  chr
print(0b01000001)　　　　  #65
print(chr(0b01000001))　　#A
print(chr(65))　　　　　　　#A

# 将字符转化为数字  ord
print(ord('A'))　　　　 #65

print(chr(9326))　　　　　
print(ord('①'))　　　　#9312

# -128 ~127: 一个字节占8个二进制位，首位为符号位
# -32768~32767
# 11111111 ~ 01111111 => -127 ~ 127 | 10000000(-128), 00000000 => -128 ~127
# 原码 补码

print('abc呵呵'.encode('utf-8'))　　　　#b'abc\xe5\x91\xb5\xe5\x91\xb5'

print(b'abc\xe5\x91\xb5\xe5\x91\xb5'.decode('utf-8'))　　#abc呵呵


# 二进制流
print(126187 * 16 + 7)    #字节大小计算

'''

二，三种字符串

# 普通字符串：u'以字符作为输出单位'

print(u'abc')  # 用于显示  abc

# 二进制字符串：b'' 二进制字符串以字节作为输出单位

print(b'abc')  # 用于传输  b'abc'

  # 原义字符串：r'以字符作为输出单位，所有在普通字符串中能被转义的符号在这都原样输出' print(u'a\tb\nc') print(r'a\tb\nc') # 取消转义 print(r'F:\python8期\课堂内容\day08\代码\1.三种字符串.py')

三，文件操作的三步骤

'''

1.打开文件: 硬盘空间被操作系统持有，文件对象被应用程序持有


　　f = open('source.txt', 'r', encoding='utf-8')

2.操作文件


　　data = f.read()



3.释放文件：释放操作系统对硬盘空间的持有

　　f.close()

'''

四，基础的读

f = open('source.txt', 'r', encoding='utf-8')

f.read()  # 将所有内容一次性读完

f.read(10)  # 读取指定字符数

f.readline()  # 一次读取一行(文件的换行标识就是结束本次读取的依据)

f.readlines()  # 将所有内容读存，按换行标识作为读取一次的依据，存放为列表

f.close()

五，基础的写

wf = open('target.txt', 'w', encoding='utf-8')

wf.write('123\n')  # 一次写一条，行必须用\n标识

wf.write('456\n')

wf.flush()  # 向操作系统发送一条将内存中写入的数据刷新到硬盘

wf.write('789\n')

wf.writelines(['abc\n', 'def\n', 'xyz\n'])  # 一次写多行，行必须用\n标识

wf.close()  # 1.将内存中写入的数据刷新到硬盘 2.释放硬盘空间

六，with_open语法

# 优化整合了文件资源的打开与释放

#        -- 在with的缩进内可以操作文件对象，一旦取消缩进，资源就被释放了

# part1

# as起别名，rf持有文件资源的变量

with open('target.txt', 'r', encoding='utf-8') as rf:

    # 文件操作的具体代码

# 缩进一旦取消缩进，资源就被释放了

# part2

with open('target.txt', 'r', encoding='utf-8') as rf1, open('target1.txt', 'r', encoding='utf-8') as rf2:

    print(rf1.read())

    print(rf2.read())

# print(rf1.read())  # 报错

# print(rf2.read())  # 报错

# part3

with open('target.txt', 'r', encoding='utf-8') as rf1:

    with open('target1.txt', 'r', encoding='utf-8') as rf2:

        print(rf1.read())

        print(rf2.read())

    # print(rf1.read())  # 可以操作

    # print(rf2.read())  # 不可以操作

七，文件的操作模式

'''


主模式：r | w | a | x

    -- 主模式只能选取一个，规定着主要的操作方式

从模式：t | b | +

    -- 从模式也必须出现，但个数不一定是一个，为主模式额外添加功能

r: 读，文件必须有，没有则报错

w: 清空写，文件可有可无，有则情况写，没有创建写

a: 追加写，文件可有可无，有则追加写，没有创建写

x：创建写，文件必须无，文件有则报错

t：默认，按字符操作

b：按字节操作

+：可读可写

#按照字符形式：

# rt: 文件必须提前存在，不存在报错，文件操作采用字符形式 - 简写为 r

# wt: 文件可以存在，也可以不存在，存在则清空后写入，不存在新建后写入，文件操作采用字符形式 - 简写为 w

# at: 文件可以存在，也可以不存在，存在在之前内容的末尾追加写入，不存在新建后写入，文件操作采用字符形式 - 简写为 a

#按照字节形式：

# rb: 文件必须提前存在，不存在报错，文件操作采用字节形式

# wb: 文件可以存在，也可以不存在，存在则清空后写入，不存在新建后写入，文件操作采用字节形式

# ab: 文件可以存在，也可以不存在，存在在之前内容的末尾追加写入，不存在新建后写入，文件操作采用字节形式

# r+t：文件必须存在的可读可写，默认从头开始替换写，按字符操作

# w+t：文件存在清空不存在创建的可读可写，按字符操作

# a+t：文件存在追加不存在创建的可读可写，按字符操作

# r+b：文件必须存在的可读可写，默认从头开始替换写，按字节操作

# w+b：文件存在清空不存在创建的可读可写，按字节操作

# a+b：文件存在追加不存在创建的可读可写，按字节操作

'''

八，文件的操作编码问题

'''

t模式下：原文件采用什么编码，你就选取什么编码操作，如果不选取，默认跟操作系统保持一致

    -- t模式下一定要指定编码

b模式下：硬盘的数据就是二进制，且能根据内容识别出编码，写入时的数据也是通过某种编码提前处理好的，所有在操作时，没有必要再去规定编码

'''

九，文件的复制

# 文本文件的复制：可以t也可以b

with open('target.txt', 'r', encoding='utf-8') as rf:

    with open('target2.txt', 'w', encoding='utf-8') as wf:

        for line in rf:

            wf.write(line)

with open('target.txt', 'rb') as rf:

    with open('target3.txt', 'wb') as wf:

        for line in rf:

            wf.write(line)

# 非文本文件只能采用b模式操作，不需要指定编码 - 因为根本不涉及编码解码过程

with open('001.mp4', 'rb') as rf:

    with open('002.mp4', 'wb') as wf:

        for line in rf:

            wf.write(line)

十，游标操作

# 1.游标操作的是字节，所有只能在b模式下进行操作

# 2.游标操作可以改变操作位置，r模式下可以改变位置进行操作，所有主模式选择r模式

# 3.seek(offset, whence):

#       -- offset为整数就是往后偏移多少个字节，负数就是往前偏移多少个字节

#       -- whence：代表将游标置为开头，代表从当前位置，代表将游标置为末尾

# 你是日本人

with open('target.txt', 'rb') as f:

    # 先读6个字节

    data = f.read(6)

    print(data.decode('utf-8'))  # 你是

    # 将游标从头开始往后偏移3个字节

    f.seek(3, 0)

    data = f.read(6)

    print(data.decode('utf-8'))  # 是日

    # 从当前游标位置往前偏移3个字节

    f.seek(-3, 1)

    data = f.read(3)

    print(data.decode('utf-8'))  # 日

    f.seek(-3, 2)

    data = f.read(3)

    print(data.decode('utf-8'))  # 人

十一，游标案例

'''

#秒传案例

id_str = b''

with open('001.mp4', 'rb') as f:

    data = f.read()

    length = len(data)

    print(length)

    f.seek(0, 0)   　　　　　　

    id_str += f.read(10)    　#读10个字节

    f.seek(length // 2, 0)

    id_str += f.read(10)

    f.seek(-10, 2)　　　　　　　#从当前游标位置往前偏移10个字节

    id_str += f.read(10)

print(id_str)

new_id_str = b''

with open('002.mp4', 'rb') as f:

    data = f.read()

    length = len(data)

    print(length)

    f.seek(0, 0)

    new_id_str += f.read(10)

    f.seek(length // 2, 0)

    new_id_str += f.read(10)

    f.seek(-10, 2)

    new_id_str += f.read(10)

if new_id_str == id_str:

    print('秒传成功')

else:

    print('慢传')

'''

day08（字符编码，字符与字节，文件操作）的更多相关文章

19-3-8Python中编码的进阶、文件操作初识、深浅copy
编码的进阶 ASCII:英文字母,数字,特殊符号,——> 二进制的对应关系 Str: 1个字符——> 1个字节 Unicode:万国码:世界上所有的文字与二进制的对应关系 1个字符——& ...
java字节流和字符流，以及java文件操作
A.首先说字节流:1.字节流在操作的时候不会用到缓冲区(也就是内存)2.字节流可用于任何类型的对象,包括二进制对象3.字节流处理单元为1个字节,操作字节和字节数组.InputStream是所有字节输入 ...
Java字符流和字节流对文件操作
记得当初自己刚开始学习Java的时候,对Java的IO流这一块特别不明白,所以写了这篇随笔希望能对刚开始学习Java的人有所帮助,也方便以后自己查询.Java的IO流分为字符流(Reader,Writ ...
day08 跟着太白老师学python 文件操作
文件操作初识: 1. 文件路径 :d:/护士主妇空姐联系方式 (文件路径不要太过复杂,容易碰到转义字符的问题, 当碰到转义字符时,需要在前面+r,或者采用双斜杠(//)) 2. 编码方式 :utf- ...
java字符编码,字符转码
编码:String->byte[]; str.getBytes(charsetName) 解码:byte[]->String; new String(byte[],charsetName) ...
python文件操作与字符编码
知识内容: 1.文件对象与文件处理流程 2.基本操作 3.上下文管理 4.文件的修改与文件内光标的移动 5.字符编码一.文件对象与文件处理流程 1.文件对象 (1)文件分类按文件中数据的组织形式可 ...
python字符编码-文件操作
字符编码字符编码历史及发展为什么有字符编码 ''' 原因:人们想要将数据存入计算机计算机的能存储的信息都是二进制的数据内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,所以计 ...
python文件操作：字符编码与文件处理
一.字符编码二.文件处理一.字符编码储备知识点: 1. 计算机系统分为三层: 应用程序操作系统计算机硬件 2. 运行python程序的三个步骤 1. 先启动python解释器 2. 再将py ...
字符编码和python文件操作
字符编码和文件操作目录字符编码和文件操作 1. 字符编码 1.1 什么是字符编码 1.2 字符编码的发展史 1.2.1 ASCII码 1.2.2 各国编码 1.2.3 Unicode 1.3 字符 ...
python字符编码与文件操作
目录字符编码字符编码是什么字符编码的发展史字符编码实际应用编码与解码乱码问题 python解释器层面文件操作文件操作简介文件的内置方法文件的读写模式文件的操作模式作业答案第 ...

随机推荐

【TensorFlow篇】--Tensorflow框架可视化之Tensorboard
一.前述 TensorBoard是tensorFlow中的可视化界面,可以清楚的看到数据的流向以及各种参数的变化,本文基于一个案例讲解TensorBoard的用法. 二.代码设计一个MLP多层神经网 ...
Linux维护之nginx宕机，端口被占用
1.重启时错误如下 2.端口被占用,执行如下命令 [root@hwc]fuser -k /tcp 3.重启nginx服务 4.显示重启成功. 查看被占用的端口情况 netstat -tln | g ...
微信小程序初体验，入门练手项目--通讯录，后台是阿里云服务器（一）
内容: 一.前言二.相关概念三.开始工作四.启动项目起来五.项目结构六.设计理念七.路由八.部署线上后端服务同步交流学习社区: https://www.mwcxs.top/page/4 ...
.NetCore 使用Cookie
1.首先我们在Startup下面的ConfigureServices中注册授权认证服务以及AddCookie services.AddAuthentication(CookieAuthenticati ...
.NET Core微服务之基于Steeltoe使用Zipkin实现分布式追踪
Tip: 此篇已加入.NET Core微服务基础系列文章索引 => Steeltoe目录快速导航: 1. 基于Steeltoe使用Spring Cloud Eureka 2. 基于Steelt ...
理解 Linux 中 `ls` 的输出
ls 的输出会因各 Linux 版本变种而略有差异,这里只讨论一般情况下的输出. 下面是来自 man page 关于 ls 的描述: $ man ls ls - list directory cont ...
XML的创建、解析-C语言
前言:今天在做一个小项目时,客户要求的xml,跟现在有系统要求的不一样,所以要自己重新写函数支持返回,进行简单总结,希望对大家有所帮助. 首先,使用xml函数需要链上动态库libxml2,需要在电脑上 ...
React-代码复用(mixin.hoc.render props)
前言最近在学习React的封装,虽然日常的开发中也有用到HOC或者Render Props,但从继承到组合,静态构建到动态渲染,都是似懂非懂,索性花时间系统性的整理,如有错误,请轻喷~~ 例子以下 ...
Django学习之八：forms组件【对form舒心了】
目录 Django forms组件 bound and unbound form instance forms渲染有关隐藏一个字段,不渲染它 form 校验 form类 ModelForm 利用Mo ...
webpack4.x笔记-配置基本的前端开发环境（一）
webpack的基本使用 webpack 本质上是一个打包工具,它会根据代码的内容解析模块依赖,帮助我们把多个模块的代码打包.借用 webpack 官网的图片: 虽然webpack4.x的版本可以零配 ...

day08（字符编码，字符与字节，文件操作）

一，复习

二，三种字符串

三，文件操作的三步骤

四，基础的读

五，基础的写

六，with_open语法

七，文件的操作模式

八，文件的操作编码问题

九，文件的复制

十，游标操作

十一，游标案例

day08（字符编码，字符与字节，文件操作）的更多相关文章

随机推荐

热门专题