一,复习

'''
类型转换

1.数字类型:int() | bool() | float() 2.str与int: int('10') | int('-10') | int('0') | float('-.5') | float('3.14') | str(数字) 3.重点 - str与list:

   'abc' => ['a', 'b', 'c']: list('abc') | ''.join(['a', 'b', 'c'])
   'abc|def|xyz' => ['abc', 'def', 'xyz']: s.split('|') | '|'.join(ls) 4.list、set、tuple:类型() 5.list与dict:

  a=1&b=2&c=3 <=> [('a', 1), ('b', 2), ('c', 3)] <=> {'a': 1, 'b': 2, 'c': 3}   dic = {}
   for k, v in [('a', 1), ('b', 2), ('c', 3)]:
  dic[k] = v    ls = []
  for k, v in {'a': 1, 'b': 2, 'c': 3}.items():
  ls.appen((k, v)) 6.可以通过字典构建任意数据的映射关系:

   type_map = {
   1: '壹',
  '壹': 1,
   'owen':(1, 88888),
   'add': add # add是功能(函数)
   } 字符编码:
编码表:人能识别的符号与机器能识别的符号(01组成的二进制码)映射关系
py2:ASCII,常用ASCII表只有英文、数字、英文符号与与机器能识别的符号的对应关系
py3:utf-8,是unicode编码表的一种实现方式,采用变长存储数据,字母数字简单符号1个字节,中文3~6字节 utf-8: 变长,在英文数字较多时,更节省空间,用于传输,cpu与硬盘中采用的编码格式
utf-16: 定长,英文数字汉字都是采用2个字节,读存效率高,内存中采用的编码格式 gbk => utf-8: 转码
  普通字符串 => 二进制字符串:编码,目的是用于传输数据 'abc'.encode('utf-8')
   二进制字符串 => 普通字符串:解码,目的是用于显示数据 b'abc'.decode('utf-8')  例子:
# ascii与字符的相互转换
print(10)
print(0B1010)   # 二进制 0b
print(0o12) ·   # 八进制 0o
print(0xa)     # 十六进制 0x # 将数字转化为字符 chr
print(0b01000001)     #65
print(chr(0b01000001))  #A
print(chr(65))       #A # 将字符转化为数字 ord
print(ord('A'))     #65 print(chr(9326))     
print(ord('①'))    #9312 # -128 ~127: 一个字节占8个二进制位,首位为符号位
# -32768~32767
# 11111111 ~ 01111111 => -127 ~ 127 | 10000000(-128), 00000000 => -128 ~127
# 原码 补码 print('abc呵呵'.encode('utf-8'))    #b'abc\xe5\x91\xb5\xe5\x91\xb5'
print(b'abc\xe5\x91\xb5\xe5\x91\xb5'.decode('utf-8'))  #abc呵呵

# 二进制流
print(126187 * 16 + 7) #字节大小计算

'''

二,三种字符串

# 普通字符串:u'以字符作为输出单位'
print(u'abc') # 用于显示 abc # 二进制字符串:b'' 二进制字符串以字节作为输出单位
print(b'abc') # 用于传输 b'abc'
  # 原义字符串:r'以字符作为输出单位,所有在普通字符串中能被转义的符号在这都原样输出' print(u'a\tb\nc') print(r'a\tb\nc') # 取消转义 print(r'F:\python8期\课堂内容\day08\代码\1.三种字符串.py')

三,文件操作的三步骤

'''
1.打开文件: 硬盘空间被操作系统持有,文件对象被应用程序持有

  f = open('source.txt', 'r', encoding='utf-8') 2.操作文件

  data = f.read()

3.释放文件:释放操作系统对硬盘空间的持有
  f.close()
'''

四,基础的读

f = open('source.txt', 'r', encoding='utf-8')
f.read() # 将所有内容一次性读完
f.read(10) # 读取指定字符数
f.readline() # 一次读取一行(文件的换行标识就是结束本次读取的依据)
f.readlines() # 将所有内容读存,按换行标识作为读取一次的依据,存放为列表
f.close()

五,基础的写

wf = open('target.txt', 'w', encoding='utf-8')

wf.write('123\n')  # 一次写一条,行必须用\n标识
wf.write('456\n')
wf.flush() # 向操作系统发送一条将内存中写入的数据刷新到硬盘
wf.write('789\n')
wf.writelines(['abc\n', 'def\n', 'xyz\n']) # 一次写多行,行必须用\n标识 wf.close() # 1.将内存中写入的数据刷新到硬盘 2.释放硬盘空间

六,with_open语法

# 优化整合了文件资源的打开与释放
# -- 在with的缩进内可以操作文件对象,一旦取消缩进,资源就被释放了 # part1
# as起别名,rf持有文件资源的变量
with open('target.txt', 'r', encoding='utf-8') as rf:
# 文件操作的具体代码
# 缩进一旦取消缩进,资源就被释放了 # part2
with open('target.txt', 'r', encoding='utf-8') as rf1, open('target1.txt', 'r', encoding='utf-8') as rf2:
print(rf1.read())
print(rf2.read()) # print(rf1.read()) # 报错
# print(rf2.read()) # 报错 # part3
with open('target.txt', 'r', encoding='utf-8') as rf1:
with open('target1.txt', 'r', encoding='utf-8') as rf2:
print(rf1.read())
print(rf2.read())
# print(rf1.read()) # 可以操作
# print(rf2.read()) # 不可以操作

七,文件的操作模式

'''

主模式:r | w | a | x

-- 主模式只能选取一个,规定着主要的操作方式
从模式:t | b | +
-- 从模式也必须出现,但个数不一定是一个,为主模式额外添加功能 r: 读,文件必须有,没有则报错
w: 清空写,文件可有可无,有则情况写,没有创建写
a: 追加写,文件可有可无,有则追加写,没有创建写
x:创建写,文件必须无,文件有则报错 t:默认,按字符操作
b:按字节操作
+:可读可写 #按照字符形式:
# rt: 文件必须提前存在,不存在报错,文件操作采用字符形式 - 简写为 r
# wt: 文件可以存在,也可以不存在,存在则清空后写入,不存在新建后写入,文件操作采用字符形式 - 简写为 w
# at: 文件可以存在,也可以不存在,存在在之前内容的末尾追加写入,不存在新建后写入,文件操作采用字符形式 - 简写为 a #按照字节形式:
# rb: 文件必须提前存在,不存在报错,文件操作采用字节形式
# wb: 文件可以存在,也可以不存在,存在则清空后写入,不存在新建后写入,文件操作采用字节形式
# ab: 文件可以存在,也可以不存在,存在在之前内容的末尾追加写入,不存在新建后写入,文件操作采用字节形式 # r+t:文件必须存在的可读可写,默认从头开始替换写,按字符操作
# w+t:文件存在清空不存在创建的可读可写,按字符操作
# a+t:文件存在追加不存在创建的可读可写,按字符操作 # r+b:文件必须存在的可读可写,默认从头开始替换写,按字节操作
# w+b:文件存在清空不存在创建的可读可写,按字节操作
# a+b:文件存在追加不存在创建的可读可写,按字节操作
'''

八,文件的操作编码问题

'''
t模式下:原文件采用什么编码,你就选取什么编码操作,如果不选取,默认跟操作系统保持一致
-- t模式下一定要指定编码 b模式下:硬盘的数据就是二进制,且能根据内容识别出编码,写入时的数据也是通过某种编码提前处理好的,所有在操作时,没有必要再去规定编码
'''

九,文件的复制

# 文本文件的复制:可以t也可以b
with open('target.txt', 'r', encoding='utf-8') as rf:
with open('target2.txt', 'w', encoding='utf-8') as wf:
for line in rf:
wf.write(line) with open('target.txt', 'rb') as rf:
with open('target3.txt', 'wb') as wf:
for line in rf:
wf.write(line) # 非文本文件只能采用b模式操作,不需要指定编码 - 因为根本不涉及编码解码过程
with open('001.mp4', 'rb') as rf:
with open('002.mp4', 'wb') as wf:
for line in rf:
wf.write(line)

十,游标操作

# 1.游标操作的是字节,所有只能在b模式下进行操作
# 2.游标操作可以改变操作位置,r模式下可以改变位置进行操作,所有主模式选择r模式
# 3.seek(offset, whence):
# -- offset为整数就是往后偏移多少个字节,负数就是往前偏移多少个字节
# -- whence:代表将游标置为开头,代表从当前位置,代表将游标置为末尾 # 你是日本人
with open('target.txt', 'rb') as f:
# 先读6个字节
data = f.read(6)
print(data.decode('utf-8')) # 你是
# 将游标从头开始往后偏移3个字节
f.seek(3, 0)
data = f.read(6)
print(data.decode('utf-8')) # 是日
# 从当前游标位置往前偏移3个字节
f.seek(-3, 1)
data = f.read(3)
print(data.decode('utf-8')) # 日 f.seek(-3, 2)
data = f.read(3)
print(data.decode('utf-8')) # 人

十一,游标案例

'''
#秒传案例 id_str = b''
with open('001.mp4', 'rb') as f:
data = f.read()
length = len(data)
print(length)
f.seek(0, 0)       
id_str += f.read(10)  #读10个字节
f.seek(length // 2, 0)
id_str += f.read(10)
f.seek(-10, 2)       #从当前游标位置往前偏移10个字节
id_str += f.read(10)
print(id_str) new_id_str = b''
with open('002.mp4', 'rb') as f:
data = f.read()
length = len(data)
print(length)
f.seek(0, 0)
new_id_str += f.read(10)
f.seek(length // 2, 0)
new_id_str += f.read(10)
f.seek(-10, 2)
new_id_str += f.read(10) if new_id_str == id_str:
print('秒传成功')
else:
print('慢传') '''

day08(字符编码,字符与字节,文件操作)的更多相关文章

  1. 19-3-8Python中编码的进阶、文件操作初识、深浅copy

    编码的进阶 ASCII:英文字母,数字,特殊符号,——>  二进制的对应关系 Str: 1个字符——> 1个字节 Unicode:万国码:世界上所有的文字与二进制的对应关系 1个字符——& ...

  2. java字节流和字符流,以及java文件操作

    A.首先说字节流:1.字节流在操作的时候不会用到缓冲区(也就是内存)2.字节流可用于任何类型的对象,包括二进制对象3.字节流处理单元为1个字节,操作字节和字节数组.InputStream是所有字节输入 ...

  3. Java字符流和字节流对文件操作

    记得当初自己刚开始学习Java的时候,对Java的IO流这一块特别不明白,所以写了这篇随笔希望能对刚开始学习Java的人有所帮助,也方便以后自己查询.Java的IO流分为字符流(Reader,Writ ...

  4. day08 跟着太白老师学python 文件操作

    文件操作初识: 1. 文件路径 :d:/护士主妇空姐联系方式  (文件路径不要太过复杂,容易碰到转义字符的问题, 当碰到转义字符时,需要在前面+r,或者采用双斜杠(//)) 2. 编码方式 :utf- ...

  5. java字符编码,字符转码

    编码:String->byte[]; str.getBytes(charsetName) 解码:byte[]->String; new String(byte[],charsetName) ...

  6. python文件操作与字符编码

    知识内容: 1.文件对象与文件处理流程 2.基本操作 3.上下文管理 4.文件的修改与文件内光标的移动 5.字符编码 一.文件对象与文件处理流程 1.文件对象 (1)文件分类 按文件中数据的组织形式可 ...

  7. python字符编码-文件操作

    字符编码 字符编码历史及发展 为什么有字符编码 ''' 原因:人们想要将数据存入计算机 计算机的能存储的信息都是二进制的数据 内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,所以计 ...

  8. python文件操作:字符编码与文件处理

    一.字符编码 二.文件处理 一.字符编码 储备知识点: 1. 计算机系统分为三层: 应用程序 操作系统 计算机硬件 2. 运行python程序的三个步骤 1. 先启动python解释器 2. 再将py ...

  9. 字符编码和python文件操作

    字符编码和文件操作 目录 字符编码和文件操作 1. 字符编码 1.1 什么是字符编码 1.2 字符编码的发展史 1.2.1 ASCII码 1.2.2 各国编码 1.2.3 Unicode 1.3 字符 ...

  10. python字符编码与文件操作

    目录 字符编码 字符编码是什么 字符编码的发展史 字符编码实际应用 编码与解码 乱码问题 python解释器层面 文件操作 文件操作简介 文件的内置方法 文件的读写模式 文件的操作模式 作业 答案 第 ...

随机推荐

  1. SpringBoot基础系列一

    SpringBoot基础知识概览 特性 核心理念:约定优于配置 特点: 1. 开箱即用,根据项目依赖自动配置 2. 功能强大的服务体系,如嵌入式服务.安全 3. 绝无代码生成,不用写.xml配置,用注 ...

  2. C++ 之 简单的五子棋AI程序

    本人是大一新生,寒假无聊,抱着试试看的心态(没有想到可以完成),写了C++的简单五子棋程序,开心.     下面是效果图:     一.首先讲讲大致思路.            五子棋实现的基础:  ...

  3. 从壹开始微服务 [ DDD ] 之三 ║ 简单说说:领域、子域、限界上下文

    前言 哈喽大家好,DDD领域驱动设计系列又开始了,前天周二的那篇入门文章中,也收到了一定的效果(写小说的除外),同时我也是倍感鸭梨,怎么说呢,DDD领域驱动设计已经有十年历史了,甚至更久,但是包括我在 ...

  4. Spring基础系列-Web开发

    原创作品,可以转载,但是请标注出处地址:https://www.cnblogs.com/V1haoge/p/9996902.html SpringBoot基础系列-web开发 概述 web开发就是集成 ...

  5. Jquer + Ajax 制作上传图片文件

    没什么 说的  直接 上代码 //选择图片并上传 function selectImg(node){ var f = node.value; var file = node.files[0]; if( ...

  6. 从零开始学安全(四十六)●sqli-labs 1-4关 涉及的知识点

    Less-1 到Less-4  基础知识注入 我们可以在 http://127.0.0.1/sqllib/Less-1/?id=1 后面直接添加一个 ‘ ,来看一下效果: 从上述错误当中,我们可以看到 ...

  7. Gerrit系统框架介绍

    Gerrit目录介绍 转自:https://blog.csdn.net/tanshizhen119/article/details/79889242 先上图 bin/ : 主要是放gerrit.sh启 ...

  8. .net 笔试面试总结(1)

    趁着在放假时候,给大家总结一点笔试面试上的东西,也刚好为年后跳槽做一点小积累. 下面的参考解答只是帮助大家理解,不用背,面试题.笔试题千变万化,不要梦想着把题覆盖了,下面的题是供大家查漏补缺用的,真正 ...

  9. 前端零基础 --css转换--skew斜切变形 transfor 3d

    前端零基础 --css转换--skew斜切变形 transfor 3d==============重要不紧急! 重要紧急 重要不紧急 不重要紧急 不重要不紧急

  10. IDEA 安装配置可视化 MongDB 插件

    IDEA 安装配置可视化 MongDB 插件 1.安装MongoDB插件 打开 IDEA ,file --> settings --> plugins,在右边搜索栏中输入Mongo,点击 ...