Day03:集合、文件处理和函数基础
上节课复习:
1.总结
可变/不可变:
可变类型:list,dict
不可变类型:int,float,str,tuple
存值的个数:
存一个值:int,float,str
存多个值:list,dict,tuple
访问方式:
只能通过变量名直接访问:int,float
可以通过索引访问(有序/序列):str,list,tuple
可以通过key访问:dict
for:重复取值
while:重复做事
2.字符编码
内存中统一使用unicode,特点是:
1.兼容万国字符
2.与其他国家编码都有对应关系
保证不乱码的关键:
1.采用的字符编码表能够兼容你要存放的字符
2.字符用什么编码标准存放的,就该用什么编码标准取解码
python2:ASCII
python3:utf-8
在文件头:
#coding:gbk
python3: str类型是unicode编码的
python2: str类型是unicode.encode('文件头指定的编码')之后的结果
x=u'你':存成unicode
今日内容:
1.集合
2.文件处理
3.函数
1.什么是函数
2.为何用函数
3.函数的分类,如何用函数
4.定义函数
5.调用函数
6.形参与实参的详细作用(!!)
7.函数对象
8.函数嵌套
9.名称空间与作用域(!!)
一.集合
类型:
作用:
1.去重
2.关系运算(集合设计之初用于关注群体间的关系,而非个体)
定义:逗号分隔开多个元素
注意:
1.每一个元素都必须是不可变类型
2.集合内的元素不能重复
3.集合内元素无序,不支持索引
优先掌握:
1.集合的定义及注意点
2.集合的关系运算
3.len, in, not ,in
4.for循环遍历集合
需要掌握:
1.集合的去重以及局限性
2.往集合内添加或删除元素,add,update,pop,remove,discard
pythoners=['tom','alex','andy','rocky','lily']
linuxers=['walter','tao','karen','andy','alex']
l=[]
for item in pythoners:
if item in linuxers:
l.append(item)
print (l)
输出: # ['alex', 'andy']
#去重
#局限性:
#1.不能保证原来的顺序
#2.不能针对可变类型去重
l=[1,1,1,1,'andy','tom']
s=set(l)
print(s)
l=list(s)
print(l)
输出:
{1, 'andy', 'tom'}
[1, 'andy', 'tom']
l=[1,1,1,1,'andy','tom']
for item in s:
print(item)
输出:
1
andy
tom
#需求:
#1.列表内的元素有可变类型
#2.去重之后要保证原来的顺序
info=[
{'name':'andy','age':''},
{'name':'tom','age':''},
{'name':'alex','age':''},
{'name':'andy','age':''},
{'name':'andy','age':''}
]
l=[]
for dic in info:
if dic not in l:
l.append(dic)
info=l
print(info)
输出:
[{'name': 'andy', 'age': '18'}, {'name': 'tom', 'age': '23'}, {'name': 'alex', 'age': '36'}, {'name': 'andy', 'age': '20'}]
#关系运算
pythoners={'tom','alex','andy','rocky','lily'}
linuxers={'walter','tao','karen','andy','alex'} #1.求既报名linux又报名oython的学员名单
print(pythoners&linuxers)
#2.只报名python, 没有报名linux的学员名单,即集合pythoners-linuxers,差集
print(pythoners-linuxers)
#3.只报名linux, 没有报名python的学员名单,即集合linuxers-pythoners,差集
print(linuxers-pythoners)
print(linuxers.difference(pythoners))
#4.求所有报名学员名单,求并集
print(pythoners|linuxers)
print(pythoners.union(linuxers))
#5.求没有同时报名两门课程的学院奖名单,对称差集
print(pythoners^linuxers)
输出:
{'andy', 'alex'}
{'rocky', 'lily', 'tom'}
{'karen', 'walter', 'tao'}
{'karen', 'walter', 'tao'}
{'tao', 'rocky', 'lily', 'tom', 'karen', 'andy', 'walter', 'alex'}
{'tao', 'rocky', 'lily', 'tom', 'karen', 'andy', 'walter', 'alex'}
{'karen', 'tao', 'walter', 'rocky', 'lily', 'tom'}
#集合的其他方法:
s1={1,2,3,4,5,}
s1.add(6)
print(s1)
s2={3,4}
s1.difference(s2)
#差集取到后更新s1的值
s1.difference_update(s2)
print (s1)
#删除某个值
s1.discard(2)
print(s1)
#验证是否有共同部分
s3={6,7}
print(s1.isdisjoint(s3))
#删除
print(s1.pop()) #随机删除
s1.discard(33333)#指定元素,若不存在也不报错
s1.remove(333)#指定元素,若不存在则报错
#更新
s1.update('hello')
print(s1)
输出:
{1, 2, 3, 4, 5, 6}
{1, 2, 5, 6}
{1, 5, 6}
False
1
{5, 6}
二.文件处理
1.什么是文件
文件是操作系统为应用程序或用户提供的一个操作硬盘的虚拟单位
2.为什么要用文件
应用程序中需要经常将内存的数据永久保存下来,而应用程序又无法直接操作硬盘,只能通过操作系统提供的单位去间接地操作硬盘
3.如何用文件
f=open(r'D:\tools\a.txt',mode='r')
f=>应用程序中的一个值=>OS打开的文件a.txt=>硬盘中的一块空间
总结:文件处理步骤
1.打开文件
2.读/写文件
3.关闭文件
上下文自动管理工具,code1运行完后会自动关闭文件并可以同时打开很多文件。
wirh open(r'D:\tools\a.txt',mode='r') as f,\
open (r'D:\tools\b.txt',mode='r') as f1:
code1
文件的打开模式:
r:只读模式(默认的)
w:只写模式
a:只追加写
t:text文本模式(默认的),该模式下操作文件内容的单位都是字符串,该模式只适用于文本文件
强调:该模式下必须指定encoding="某种字符编码"
b:bytes二进制模式,该模式下操作文件的内容单位都是bytes,该模式适用于所有就类型的文件
#r模式
with open('a.txt',mode='rt',encoding='uth-8') as f:
data1=f.read()
print('First:',data1)
data2=f.read()
print('Second',data2) print(f.readable())
print(f.writable())
f.write('hello') line1=f.readline()
print(line1,end='')
print('===>')
line2 = f.readline()
print(line2,end='') l=f.readlines()
print(1,type(1))
输出:
First: 你好啊
aa
wco
Second
#w模式:只写模式
#文件不存在则创建一个空文件,并且文件指针跳到文件的开头
#文件存在,会将内容清空,并且文件指针调用到文件开头
#强调:1.如果每次打开都是重新打开文件,那么文件内容总会被清空
# 2.如果在打开文件不关闭的情况下,连续写入,本次写入会跟着上次写入
with open('b.txt',mode='wt',encoding='utf-8') as f:
print(f.readable)
list=['\naa\n','bb\n','cc\n','dd\n']
f.write('你好')
f.write('我的天')
for line in list: #法一:for写入
f.write(line)
#f.writelines(list) #法二:批量写入
输出:
<built-in method readable of _io.TextIOWrapper object at 0x0000019D984F4990>
#a模式:只追加写模式
#文件不存在则
with open('b.txt',mode='at',encoding='utf-8') as f:
print(f.readable())
print(f.writable())
f.write('你好\n')
f.writelines(['aaa\n','bbb\n'])
输出:
False
True
#b模式:bytes二进制模式,该模式下操作文件内容单位都是bytes.
#强调:一定不能指定encoding参数
with open('1.mp4',mode='rb') as f:
data=f.readline()
print(data,type(data)) with open('d.txt',mode='rb') as f:
data=f.read()
print(data,type(data))
res=data.decode('utf-8')
print(res) with open('d.txt','wb') as f
f.write('hahahahah') #遍历文件内容的方式
with open('d.txt',mode='rt',encoding='utf-8') as f:
for line in f:
print(line,end='') #取消默认换行符
#文件内指针操作(掌握)
#f.seek:单位统一是字节
#第一个参数:控制移动的字节数
#第二个参数:控制移动的参照物,值可以是0,1,2
#0:参照文件开头(b和t模式都能用)
#1:参照当前位置(只能在b模式用)
#2:参照文件末尾(只能在b模式用)
with open('a.txt','rt',encoding='utf-8') as f:
f.seek(3,0) #单位是字节
print(f.read())
f.read()
f.seek(0,0)
print('第二次',f.read())
输出:
hggg
第二次 ddd
hggg
#参照当前位置
#储备:read(n)
#read的n在t模式下代表字符个数
#read的n在b模式下代表字节个数
#其余都是字节 with open('a.txt','rt',encoding='utf-8') as f:
s=f.read(1)#指针在第三个bytes
print(s)
f.seek(6.0)
print(f.read())
输出:
d
ggg
#文本编辑器修改文件原理:
#优点:修改期间硬盘上同一时刻只有一份数据
#缺点:占用内存过高
with open('a.txt',mode='rt',encoding='utf-8') as f:
data=f.read()
new_data=data.replacce('a','b')
print(new_data) with open('a.txt',mode='wt',encoding='utf-8') as
f.wirte(new_data) #一行一行地读,一行一行地改:
#以只读方式打开源文件,以写模式打开一个临时文件
#然后for循环读取一行行内容,每读一行改一行,将修改结果写入临时文件,直至遍历完
#删除源文件,将临时文件重命名为原文件名
#缺点:占用2份硬盘空间
with open('a.txt',mode='rt',encoding='utf-8') as src_f:\
open('.a.txt.swap',mode='rt',encoding='utf-8') as tmp_f:\
for line in src_f:
if 'alex' in line:
line=line.replace('alex','alexsb')
temp_f.write(line)
print(line)
os.remove('a.txt')
os.remove('.a.txt.swap','a.txt')
1.什么是函数
函数是具备某一功能的工具
函数的使用必须遵循先定义后调用的原则
事先准备工具的过程即函数的定义
拿来就用即函数的调用
函数分为两大类:
a.内置函数
b.自定义函数
2.为何要用函数
2.1 程序的组织结构不清晰,可读性差
2.2 日积月累,冗余代码太多
2.3 程序的可扩展性极差
3.怎么用
1).定义函数:只检测语法,不执行代码
a.语法
def 函数名(参数1,参数2,参数3)
"""
文档注释
"""
code1
code2
code3
...
return 返回值
b.
c.定义函数的三种方式
无参函数
def func1(): #func1=函数的内存地址
print('hello1')
有参函数
def func2(x,y):
print('hello1')
空函数
def func3()
pass
a.语法:函数名()
b.调用函数的过程
i,根据函数名找到函数的内存地址
ii,函数的内存地址加括号触发函数体代码的运行
c.调用函数的三种方式
i,语句
ii,表达式形式
iii,当作参数传给其他函数
3).函数的返回值
函数体代码运行的一个成果
什么时候用函数的返回值?
如何用返回值
return 值:
1. 返回值没有类型限制
2. 返回值没有个数限制
逗号分隔多个值时,返回一个元组
没有return,默认返回None
#示范一
def bar():
print('from bar')
def foo():
print('from foo')
bar()
foo()
输出:
from foo
from bar
#示范二
def foo():
print('from foo')
bar()
def bar():
print('from bar')
foo()
输出:
from foo
from bar
#示范三
def foo():
print('from foo')
bar()
foo()
def bar():
print('from bar')
输出:
from foo
from bar
#函数调用:表达式形式
def max(x,y):
if x>y:
return x
else:
return y
res=max(1,2)
print(res)
输出:
2
#函数调用:当作参数传给其他函数
def max(x,y):
if x>y:
return x
else:
return y
res=max(max(1,2),3)
print(res)
输出:
3
#return是函数结束的标志
#函数内可以有多个return,但只要执行一次,函数体则结束
def f1():
print(1)
return 'aa'
print(2)
return 'bb'
Day03:集合、文件处理和函数基础的更多相关文章
- Python基础-week03 集合 , 文件操作 和 函数详解
一.集合及其运算 1.集合的概念 集合是一个无序的,不重复的数据组合,它的主要作用如下 *去重,把一个列表变成集合,就自动去重了 *关系测试,测试两组数据之前的交集.并集.差集.子集.父级.对称差集, ...
- Python开发基础-Day5-字符编码、文件处理和函数基础(草稿)
字符编码 为什么要有字符编码? 字符编码是为了让计算机能识别我们人写的字符,因为计算机只认识高低电平,也就是二进制数"0","1". 一个文件用什么编码方式存储 ...
- python开发基础之字符编码、文件处理和函数基础
字符编码 为什么要有字符编码? 字符编码是为了让计算机能识别我们人写的字符,因为计算机只认识高低电平,也就是二进制数"0","1". 一个文件用什么编码方式存储 ...
- Python 函数基础、有序集合、文件操作(三)
一.set 特点: set是一个无序且不重复的元素集合访问速度快:天生解决元素重复问题 方法: 初始化 >>> s1 = set()>>> print(type(s ...
- day03深浅拷贝、文件操作和函数初识
一.赋值.浅拷贝与深拷贝 直接赋值:其实就是对象的引用(别名). 浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象. 深拷贝(deepcopy): copy 模块的 deepcopy 方法, ...
- PHP常用获取文件路径的函数集合整理
转自: http://blog.sina.com.cn/s/blog_71ed1b870102vslg.html 我们在开发PHP项目过程中,经常会用到包含文件,所以有时候需要获取文件的相对路径或者绝 ...
- 《转》Python学习(17)-python函数基础部分
http://www.cnblogs.com/BeginMan/p/3171977.html 一.什么是函数.方法.过程 推荐阅读:http://www.cnblogs.com/snandy/arch ...
- python 17 函数基础(一)
http://www.cnblogs.com/BeginMan/p/3171977.html 一.什么是函数.方法.过程 推荐阅读:http://www.cnblogs.com/snandy/arch ...
- JavaScript 函数基础
1. JavaScript 函数基础 1. 定义方法 2. 函数的调用方法 3. 函数方法 apply : 将函数作为数组的方法来调用 将参数以数组形式传递给该方法 call : 将函数作为对象的 ...
随机推荐
- require.js使用
无可奈何,二开项目用了require.js! 一道槛是挨不过去了 require官网: http://requirejs.org/ require.js cdn: <script src=&qu ...
- Solaris网络基础
划分子网: 把大网缩小为若干个小网.修改子网掩码,划分多个网络. 那么如何确定子网的子网掩码和IP地址? 以上你会发现少了6个IP. Ifconfig e1000g0 down down掉网卡 ...
- python(12)- 文件处理应用Ⅰ
一.读取文件,打印第三行时后面加入“徐亚平” 程序如下: count=0 with open("test",mode="r",encoding="ut ...
- iframe截取站点的部分内容
<div style="width:630px;height:350px;overflow:hidden;border:0px"> & ...
- HDU 1418 抱歉 (欧拉公式)
[题目链接]:pid=1418">click here~~ [题目大意]: 假设平面上有n个点,而且每一个点至少有2条曲线段和它相连,就是说,每条曲线都是封闭的.同一时候,我们规定: ...
- 基于bootstrap的纯静态网站目录
一.博客页面 二.登陆页面 三.信息采集 四.管理后台 五.网站汇总(基于上边四个功能) 因为样式统一采用bootstrap的样式,所以不做介绍 样式导入可以将bootstrap下载至本地(有自动补齐 ...
- php中屏蔽date的错误
php中添加 date_default_timezone_set('asia/shanghai'); 可以屏蔽 <?php echo date('Y-m-d',$row3['time']); ...
- Oracle比较时间大小
1,比较当前时间与指定时间相差分钟数: select sysdate, sysdate - to_date('2007-04-03 13:45:39','yyyy-mm-dd hh24:mi: ...
- Struts2 原理(转载)
图来源于Struts2官方站点,是Struts 2 的整体结构. Struts2框架由3个部分组成:核心控制器FilterDispatcher.业务控制器和用户实现的业务逻辑组件.在这3个部分里,St ...
- (转)c#(wince)中使用多线程访问winform中控件的问题
我们在做winform应用的时候,大部分情况下都会碰到使用多线程控制界面上控件信息的问题.然而我们并不能用传统方法来做这个问题,下面我将详细的介绍. 首先来看传统方法: public partial ...