python之路-Day3

字典

dic{key:value}

元组
与列表相似，唯一就是不能修改

dic = {'name':'alex','age':18}
查询
print(dic['name'])   #会报错
get方法查询,查询之后，如果不包含，不会报错，返回none
print(dic.get('name'))
增加
dic['gender'] = 'lwq'
print(dic)
字典中的元素是无序的，字典是通过key找值得。
改
dic['name'] = 'dt'
字典不能改key，只能改value
删除
del dic['name']
key的定义规则：
1.必须是不可变的。如何判断数据类型是否可变：首先先定义，看id，然后再重新定义，看id，如果id变，表示可变，id不变（数字，字符串，元组），表示不可变（改变列表中的元素,字典），
name = 'lwq'  name = 'hsc'
2.只要是能hash，就能当key，hash有数就表明可以定义为key
3.字典中的key是唯一的。
value定义：都可以
字典定义：
dic3 = dict()
dic4 = dict({'name':'alex','age':18})
dic5 = dict(name='alex',age=18)
dic6 = dict((('name','ale'),('age',18)))

#dict()

#以键对方式构造字典

d1 = dict(one = 1, two = 2, a = 3)

print(d1)

#以映射函数方式来构造字典

d2 = dict(zip(['one', 'two', 'three'], [1, 2, 3]))

print(d2)

#可迭代对象方式来构造字典

d3 = dict([('one', 1), ('two', 2), ('three', 3)])

print(d3)

d4 = dict(d3)

print(d4)

dic1 = dic.copy()
dic2 = dict.fromkeys('hello',1)   #快速生成字典，可以放列表，字符串。与申明的字典无关系。 当value是{}时
dic2 = dict.fromkeys('hell',{}) 如果再向其中增加时，{}就会被一个元素占用，

dic = dict.fromkeys('hello',1)

print(dic)

dic1 = dict.fromkeys('haha')

print(dic1)

dic2 = dict.fromkeys('name',{})

print(dic2)

dic2['a'] = 'b '

print(dic2)　　

dic2['e'] = {'c':1}

print(dic2)

dic.get('name')  # dic['name']
print(dic.items())    #项目，变成列表，列表中是元组
dic.keys()   #取字典中所有的key
dic.pop('name')  #删除，必须存在才能删除
dic.popitem()  #随机删除，不需要些参数
dic.setdefault('gender','male') #增加
#或者 dic.setdefault('gender',[])
dic1 = {'haah':'111','name':'lwq'}
dic.update(dic1)  # 也可以作为修改用，与新字典做更新
dic.values()  #取字典的value

for i in dic
　　print(i)    打印的是字典所有的key

浅拷贝：
只拷贝第一层
深拷贝：
import   导入模块
import copy
dic3 = copy.deepcopy()   深拷贝

dic10 = {'name':'hsc','age':{'lwq':19,'wt':20}}
print(dic['age']['lwq'])

按存值个数区分

标量／原子类型	数字，字符串
容器类型	列表，元组，字典

按可变不可变区分

可变	列表，字典
不可变	数字，字符串，元组

按访问顺序区分

直接访问	数字
顺序访问（序列类型）	字符串，列表，元组
key值访问（映射类型）	字典

集合：解决关系运算和去重
定义：由不同的元素组成,如果有重复，就会去除掉,集合是无须得。
s1 = {'a',1,2,3,4,5,4,4,4,}
print(s1)

集合的关系运算
python_set = {'lwq','hsc','wt'}
linux_set = {'ls','lwq','hsc','lmz'}
求两个集合交集
print(python_set&linux_set)    -------print(python_set.intersection(linux_set))

并集，包含全部元素
print(python_set|linux_set)     -------print(python_set.union(linux_set))
差集
print(python_set-linux_set)     #去掉与linux_set相同的元素，打印python_set
print(python_set.difference(linux_set))
对称差集
print(python_set^linux_set)    ------print(python_set.symmetric_difference(linux_set))
子集
print(python_set.issubset(linux_set))
父集
print(python_set.issuperset(linux_set))

#增加
s1.update('e')
s1.update(s5)
s1.update('hello')   #把hello拆开加进去
s1.add('hello')      #整体加进去
s1.pop()              #随机删
s1.remove('w')   #删除不存在的元素，报错
s1.discard('w')  # 删除不存在的元素，不报错
s1.copy()         #浅拷贝
s1.clear()
s1.difference_update(s5)   #求差集并更新
s1.isdisjoint()

字符编码

首先我们在终端定义一个内存变量：name＝'林海峰'，那这个内存变量被存放到内存（必然是二进制），所以需要一个编码，就是unicode(内存中使用字符编码固定就是unicode)

但是如果我们写到文件中name＝'林海峰'保存到硬盘(必然是二进制)，也需要一个编码，这就跟各个国家有关了，假设我们用gbk，那么文件就被以gbk形式保存到硬盘上了。

程序要运行：硬盘二进制（gbk）－－－> 内存二进制（unicode）
就是说，所有程序，最终都要加载到内存，程序保存到硬盘不同的国家用不同的编码格式，但是到内存中我们为了兼容万国（计算机可以运行任何国家的程序原因在于此），统一且固定使用unicode，这就是为何内存固定用unicode的原因，你可能会说兼容万国我可以用utf－8啊，可以，完全可以正常工作，之所以不用肯定是unicode比utf－8更高效啊（uicode固定用2个字节编码，utf－8则需要计算），但是unicode更浪费空间，没错，这就是用空间换时间的一种做法，而存放到硬盘，或者网络传输，都需要把unicode转成utf－8，因为数据的传输，追求的是稳定，高效，数据量越小数据传输就越靠谱，于是都转成utf－8格式的，而不是unicode。

gbk－>unicode需要decode()，unicode->gbk需要encode()就是这个意思

浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器

python程序比较特殊，要想运行需要python解释器去调用，也就相当于python解释器去读内存的程序的unicode代码

因而python解释器也有个解释器默认编码可以用sys.getdefaultencoding()查看，如果不在python文件指定头信息＃-*-coding:utf-8-*-,那就使用默认的

注意了，这个编码，是python解释器这个软件的编码.

总结

其实无论是word也好pycharm也好，python解释器也好，我们都可当她们是处理文件的软件

注意：

python2.7解释器默认编码为ascii
python3.5解释器默认编码为utf-8
不管是python解释器也好还是其他与文本相关的软件也好，它们只能指定存取文件到硬盘的字符编码，而内存中固定使用uniccode
test.py文件的头#-*-coding:utf-8-*-就是在修改python解释器的编码

流程：

从硬盘读区test.py的二进制bytes类型数据加载到内存，此刻python解释器就是一个类word软件啊，python解释器用自己的编码，将文件的二进制解码成unicode放到内存中
python解释器从内存中读取unicode代码解释执行，执行时的代码中函数指定的编码与python解释器再无半点关系

高电压：1
低电压：0
字符   ------------------翻译的过程-------〉〉  数字
ascii --------8位2进制代表一个字符
gbk   --------16位二进制代表一个汉字
unicode 万国码
utf-8  可变长 中文用三个字节，英文用一个字节
定义的变量到内存的时候，必须用nicode编码
硬盘 ---------〉〉 字符
字符  ---unicode-----〉〉内存    固定
encode   编码    decode    解码

1.内存固定使用unicode编码，硬盘的编码（可以修改的软件）
2.使用什么编码存入硬盘，就用什么编码去读。
3.程序运行分两个阶段：1.从硬盘读到内存 2.python解释器运行已经读到内存的程序
4.针对一个.py文件，python 与pycharm\netepad++区别是多了第二个步骤
5.文件的头部标明解释器要以那种编码方式解释。

文件处理

f = open('my','w')   #w创建写模式，如果存在，就覆盖  a追加写模式   r只读模式
f.write('我爱北京'+'\n')
f.close()     #保存
#del只能删除内存对象，不能删除硬盘上的东西
#混合模式
#读写：w+   写读   清空内容，再去操作
#      a+   追加、读  追加到最后
#       r+  读写  将内容加到到第一行，并将第一行内容覆盖
f.close() #判断文件是否关闭
print(f.encoding)  #打印文件编码
print(f.fileno())    #文件在操作系统中的索引值
f.flush()   #强制刷新文件（保存）
f.isatty()  #判断是否是一个终端
f.name #打印文件名
f.readable()  #不可读的，做判断用
f.seek(10)   #寻找     将光标移动到第十个字符，打印以后的内容
f.seekable()  #是否可寻找
f.tell()    #告诉当前光标的位置
f.truncate()   #截断  从光标的位置将内容打断，后面的内容不显示（处理二进制文件），可指定大小，从头开始。
date = ['alex\n','lwq\n']
f.writelines(date)  #将列表按行插入文件
f.read()  #读取文件所有行
f.readline  #一行一行读取
f.readlines  #将文件中行以列表的形式读取出来

修改文件：
1.全部写入内存
2占用硬盘资源,修改好后删除原来的版本.

    先判断，如果不是要修改的内容就直接写入到新文件
    如果是要修改的内容，修改后写入新文件
    需要同时打开两个文件，从一个文件读，然后再写入另一个文件
    修改文件内容：

f = open('myname','r',encoding='utf-8')

f_new = open('myname_new','w',encoding='utf-8')

for line in f:

    if '常听收音机' in line:

        line = line.replace( '常听收音机', '常看电视剧')

    f_new.write(line)

f.close()

f_new.close()

处理大文件：可以读一行，删一行，这样内存就只保留一行。
for line in f:
    print(line)
如果用这种方法写的话，下次再读取文件是，光标仍在第一行行首。
f.read(5) 表示只读五个


文件读取只能读一变，如果想读第二遍必须将光标移到上面。

打印进度条：基于flush
import sys,time
for i in range(20):
    sys.stdout.write("#")
    sys.stdout.flush()
    time.sleep(0.1)


eval(date)     #将字符串转换成字典

sys.argv

import sys

就是把整个「sys」模块都导入进来了。不知道提住学没学过C/C++呢，就和他们的「#include」差不多：
你include了iostream才能系统给你的std::cout；你import了sys，才能使用系统给你的sys.argv。

然后再说说argv这个变量。
「argv」是「argument variable」参数变量的简写形式，一般在命令行调用的时候由系统传递给程序。

这个变量其实是一个List列表，argv[0] 一般是被调用的脚本文件名或全路径，和操作系统有关，argv[1]和以后就是传入的数据了。

然后我们再看调用脚本的命令行：

python using_sys.py we are arguments

python就不用说了，「using_sys.py」脚本名，后面的用空格分割开的「we」「are」「argument」就是参数了。
PS.一般参数由空格分隔，如果参数内部有空格要使用英文双引号引起来比如这样：

python using_sys.py hi "I'm 7sDream"

函数：split()

Python中有split()和os.path.split()两个函数，具体作用如下： split()：拆分字符串。通过指定分隔符对字符串进行切片，并返回分割后的字符串列表（list） os.path.split()：按照路径将文件名和路径分割开

一、函数说明 1、split()函数语法：str.split(str="",num=string.count(str))[n]

参数说明： str：表示为分隔符，默认为空格，但是不能为空('')。若字符串中没有分隔符，则把整个字符串作为列表的一个元素 num：表示分割次数。如果存在参数num，则仅分隔成 num+1 个子字符串，并且每一个子字符串可以赋给新的变量 [n]：表示选取第n个分片

注意：当使用空格作为分隔符时，对于中间为空的项会自动忽略

2、os.path.split()函数语法：os.path.split('PATH')

参数说明：

PATH指一个文件的全路径作为参数：
如果给出的是一个目录和文件名，则输出路径和文件名
如果给出的是一个目录名，则输出路径和为空文件名

二、实例 1、常用实例

>>> u = "www.doiido.com.cn"

#使用默认分隔符

>>> print u.split()

['www.doiido.com.cn']

#以"."为分隔符

>>> print u.split('.')

['www', 'doiido', 'com', 'cn']

#分割0次

>>> print u.split('.',0)

['www.doiido.com.cn']

#分割一次

>>> print u.split('.',1)

['www', 'doiido.com.cn']

#分割两次

>>> print u.split('.',2)

['www', 'doiido', 'com.cn']

#分割两次，并取序列为1的项

>>> print u.split('.',2)[1]

doiido

#分割最多次（实际与不加num参数相同）

>>> print u.split('.',-1)

['www', 'doiido', 'com', 'cn']

#分割两次，并把分割后的三个部分保存到三个文件

>>> u1,u2,u3 = u.split('.',2)

>>> print u1

www

>>> print u2

doiido

>>> print u3

com.cn

2、去掉换行符

>>> c = '''say

hello

baby'''

>>> print c

say

hello

baby

>>> print c.split('\n')

['say', 'hello', 'baby']

3、分离文件名和路径

>>> import os

>>> print os.path.split('/dodo/soft/python/')

('/dodo/soft/python', '')

>>> print os.path.split('/dodo/soft/python')

('/dodo/soft', 'python')

4、一个超级好的例子

>>> str="hello boy<[www.doiido.com]>byebye"

>>> print str.split("[")[1].split("]")[0]

www.doiido.com

>>> print str.split("[")[1].split("]")[0].split(".")

['www', 'doiido', 'com']

python之路-Day3的更多相关文章

Python之路,Day3 - Python基础3
一.文件操作对文件操作流程打开文件,得到文件句柄并赋值给一个变量通过句柄对文件进行操作关闭文件现有文件如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ...
Python之路 day3 高阶函数
#!/usr/bin/env python # -*- coding:utf-8 -*- #Author:ersa """ 变量可以指向函数,函数的参数能接收变量, 那么 ...
Python之路 day3 递归函数
#!/usr/bin/env python # -*- coding:utf-8 -*- #Author:ersa """ 在函数内部,可以调用其他函数.如果一个函数在内 ...
Python之路 day3 全局变量、局部变量
#!/usr/bin/env python # -*- coding:utf-8 -*- #Author:ersa """ 全局与局部变量在子程序中定义的变量称为局部变 ...
Python之路 day3 函数定义 *args及**kwargs
#!/usr/bin/env python # -*- coding:utf-8 -*- #Author:ersa import time # def logger(): # time_format ...
Python之路Day3
摘要: 复习day2内容介绍set()-->归档到day2了... collections模块常用类深浅copy的区别自定义函数文件操作常用内建函数介绍一.深浅copy的区别 #! ...
小白的Python之路 day3 函数式编程，高阶函数
函数式编程介绍函数是Python内建支持的一种封装,我们通过把大段代码拆成函数,通过一层一层的函数调用,就可以把复杂任务分解成简单的任务,这种分解可以称之为面向过程的程序设计.函数就是面向过程的 ...
小白的Python之路 day3 函数
1.函数基本语法及特性背景提要现在老板让你写一个监控程序,监控服务器的系统状况,当cpu＼memory＼disk等指标的使用量超过阀值时即发邮件报警,你掏空了所有的知识量,写出了以下代码 1 2 ...
Python之路
Python学习之路第一天 Python之路,Day1 - Python基础1介绍.基本语法.流程控制第一天作业第二天 Python之路,Day2 - Pytho ...

随机推荐

Could not find com.android.tools.build:gradle:1.3.0.
* What went wrong: A problem occurred configuring project ':TZYJ_Android'.> Could not re ...
sed字符串替换
把drivers目录下的所有pr_log替换成:pr_snd sed -i "s/pr_log/pr_snd/g" `grep pr_log -rl drivers/` 把driv ...
linux命令-dd {拷贝并替换}
一命令解释: dd:用指定大小的块拷贝一个文件,并在拷贝的同时进行指定的转换. 注意:指定数字的地方若以下列字符结尾,则乘以相应的数字:b=512:c=1:k=1024:w=2 参数注释: if=文 ...
【整理】动态加载Web Services
WebClient client = new WebClient(); String url = "http://localhost/MESAPIWebService/MESAPI.asmx ...
Raspberry pi之wifi设置-3
1.配件套装里最好有wifi网卡,非常小如下图插入Raspberry pi的USB口,用lsusb来查看USB设备列表如下 pi@raspberrypi~/Desktop $ lsusb Bus 0 ...
instanceof关键字
instanceof是Java.php的一个二元操作符(运算符),和==.>.<是同一类东西.由于它是由字母组成的,所以也是Java的保留关键字.它的作用是判断其左边对象是否为其右边类的实 ...
Sublime Text 3 使用
Sublime Text3使用下载安装参考:http://www.downza.cn/soft/187996.html Sublime Text Build 3126 x64 Setup.exe下 ...
8、SQL Server 表分区
什么是表分区?表分区其实就是将一个大表分成若干个小表.表分区可以从物理上将一个大表分成几个小表,但是逻辑上还是一个表.所以当执行插入.更新等操作的时候,不需要我们去判断应该插入或更新到哪个表中.只需要 ...
python随便笔记。。。
一.input().strip(),strip()的作用是不读取用户输入的空格 s.strip(rm) 删除s字符串中开头.结尾处,位于 rm删除序列的字符s.lstrip(rm) ...
关于JDK 安装，以及Java环境的设置
关于JDK 安装,以及Java环境的设置 1.下载JDK1.6,选择对应的安装路径 2.配置相应的Java 环境变量 A.属性名称:JAVA_HOME 属性值:C:\Program Files\Jav ...

python之路-Day3

总结

python之路-Day3的更多相关文章

随机推荐

热门专题