一、Python基础

Python是对象有类型,变量无类型的动态类型语言,追求简单优雅易读。可以在终端中逐行运行,也可以编写成大型的面向对象的工程。在开始写之前,注意Python 2.X中,开头要写上#coding:utf-8,并且Python通过缩进知道一个特定的代码块于周围的代码保持独立。所用的空格数很重要,因此应该使用编辑器确定缩进,并且不要手动改变空格数。根据PEP的规定,必须使用4个空格来表示每级缩排。使用Tab字符和其它数目的空格虽然都可以编译通过,但不符合编码规范。

1.数字和字符
  1. Python本身支持整数与浮点数,计算如下表
运算符 描述 示例 运算结果
+ 7 + 2 9
- 7 - 2 5
* 7 * 2 14
/ 浮点数除法 7 / 2 3.5
// 整数除法 7 // 2 3
% 求余 7 % 2 1
** 7 ** 2 49

强制类型转换使用int(num)float(num)进行。

  1. 字符串

使用引号包裹,例如:

  1. >>> 'python'
  2. 'python'
  3. >>> "python"
  4. 'python'

可见可以使用两种引号进行创建,这样的好处是可以创建本身就包含引号的字符串,而不用使用转义符。可以在双引号包裹的字符串使用单引号,或者在单引号包裹的字符串中使用双引号:

  1. >>> "'She' is a boy."
  2. "'She' is a boy."
  3. >>> 'A "boy" likes her.'
  4. 'A "boy" likes her.'

还可以使用三个单引号创建字符串:

  1. >>> '''
  2. ... 我们去看烟火好吗
  3. ... 去,去看那
  4. ... 繁花之中如何再生繁花
  5. ... 梦境之上如何再现梦境
  6. ... '''
  7. '\n我们去看烟火好吗\n去,去看那\n繁花之中如何再生繁花\n梦境之上如何再现梦境\n'
  • 在字符串中使用str(value)进行强制类型转换。

  • 使用\进行转义

  1. >>> print('a\tbc')
  2. a bc
  • 使用+进行拼接
  1. >>> a = 'apple'
  2. >>> b = 'pen'
  3. >>> a + ' ' + b
  4. 'apple pen'
  • 使用*复制
  1. >>> s = 'apple'
  2. >>> s * 3
  3. 'appleappleapple'
  • 使用[]提取字符
  1. >>> letters = 'abcdefg'
  2. >>> letters[0]
  3. 'a'
  4. >>> letters[4]
  5. 'e'
  • 使用[start:end:step]分片
  1. # [:] 提取全部
  2. # [start:] 从start到结尾
  3. # [:end] 从开头到end - 1
  4. # [start:end] 从strat到end - 1
  5. # [start:end:step] 从start到end - 1,每step个字符提取一个
  6. >>> letters = 'abcdefghijklmn'
  7. >>> letters[:]
  8. 'abcdefghijklmn'
  9. >>> letters[3:]
  10. 'defghijklmn'
  11. >>> letters[:3]
  12. 'abc'
  13. >>> letters[3:7]
  14. 'defg'
  15. >>> letters[0:4:2]
  16. 'ac'
  17. >>> letters[-1::]
  18. 'n'
  19. >>> letters[::-1]
  20. 'nmlkjihgfedcba'
  • 使用len(value)获得长度
  1. >>> letters = 'abcdefghijklmn'
  2. >>> len(letters)
  3. 14
  • 使用split(value)进行分割,value填写分割字符,返回一个列表
  1. >>> letters = 'a,b,c,d,e,f'
  2. >>> letters.split(',')
  3. ['a', 'b', 'c', 'd', 'e', 'f']
  • 同样可以使用join()将列表进行合并成字符串
  1. >>> letters_list = letters.split(',')
  2. >>> ','.join(letters_list)
  3. 'a,b,c,d,e,f'
  • 最后,可以使用`replace(sub, newsub, n), sub是需要被替换的子串,newsub是用于替换的新子串,n是需要替换多少处
  1. >>> setup = 'a boy likes playing basketball.'
  2. >>> setup.replace('boy','girl')
  3. 'a girl likes playing basketball.'
  4. >>> setup.replace('a', 'b')
  5. 'b boy likes plbying bbsketbbll.'
  6. >>> setup.replace('a', 'b', 1)
  7. 'b boy likes playing basketball.'
2.语句

1.import语句,导入模块使用,两种形式:

形式1:import module-name。import后面跟空格,然后是模块名称,例如:import os

形式2:from module1 import module11。module1是一个大模块,里面还有子模块module11,只想用module11,就这么写了。

2.条件语句:

if...elif...else语句

  1. if 条件1:
  2. 执行的内容1
  3. elif 条件2:
  4. 执行的内容2
  5. elif 条件3
  6. 执行的内容3
  7. else:
  8. 执行的内容4

3.循环语句:

for语句

  1. for 循环规则:
  2. 操作语句

for循环所应用的对象,应该是可迭代的。

判断一个对象是否可迭代使用collections模块的Iterable类型判断:

  1. >>> from collections import Iterable
  2. >>> isinstance('abc',Iterable)
  3. True
  4. >>> isinstance([1,2,3,4],Iterable)
  5. True
  6. >>> isinstance(1234,Iterable)
  7. False

while语句

和C语言中大同小异,只不过可以使用while...else...,同理,在for语句中也可以使用for... else...

  1. #test.py
  2. a = 3
  3. b = 2
  4. while a > b:
  5. print('a>b')
  6. a -= 1
  7. else:
  8. print('a<b')
  1. $ python test.py
  2. a>b
  3. a<b

循环(loop),指的是在满足条件的情况下,重复执行同一段代码。比如,while语句。

迭代(iterate),指的是按照某种顺序逐个访问列表中的每一项。比如,for语句。

递归(recursion),指的是一个函数不断调用自身的行为。比如,以编程方式输出著名的斐波纳契数列。

遍历(traversal),指的是按照一定的规则访问树形结构中的每个节点,而且每个节点都只访问一次。

3.函数

1.定义函数

使用def:函数的开头,define的缩写,后面跟函数名称和参数,最后一点要加“:”冒号。例如 def add(x,y):

2.函式体的第一个语句可以是字串(即为注释); 这个字串就是函式的文档字符串, 或称为 docstring。例如:

  1. def split_data_set(dataSet, axis, value):
  2. """
  3. 输入:数据集,选择维度,选择值
  4. 输出:划分数据集
  5. 描述:按照给定特征划分数据集;去除选择维度中等于选择值的项
  6. """

3.命名规范,这里参考PEP8

b(单个小写字母)

B(单个大写字母)

小写(小写)

lower_case_with_underscores(含底线的小写)

大写(UPPERCASE)

UPPER_CASE_WITH_UNDERSCORES(含底线的大写)

大写字母(字首大写,又称CapWords或CamelCase - 如此称呼是因为字母看起来崎岖不平[4]),有时也称为StudlyCaps。

注意:如果有缩写字,将缩写字的每个字母大写。也就是写HTTPServerError比HttpServerError好。

mixedCase(类似字首大写,只差开头单字的第一个字母是小写)

Capitalized_Words_With_Underscores(字首大写加底线)

来自命名惯例

4.参数与变量

形参与实参:

函数名后面的括号里如果有变量,它们通常被称为“形参”。调用函数的时候,给函数提供的值叫做“实参”,或者“参数”。个人理解,实参是在函数调用前就实际存在的参数,而形参是在调用函数的时候,用于将实参的值传入函数用的。

参数与变量的区别,每个形参的名称均可作为过程内的局部变量。形参名称的使用方法与其他任何变量的使用方法相同。

实参表示在您调用过程时传递给过程形参的值。

局部变量与全局变量:

在函数里面的就是局部变量,在函数外面的就是局部变量。在C和JAVA中主要是有一个主函数或主方法开始运行的地方,而Python并没有,Python是逐行运行的。但可以使用if __name__ == '__main__'来规定当前程序的程序入口是什么,防止模块之间相互引用导致入口混乱。

4.初级内建函数

1.print(value, seq=' ', end='\n') 在Python 3.X中,为一个函数,其中参数seq=' '为分隔符,参数end='\n'为结尾换行符号,可以自己修改。

Tips:

print实质是将输出重定向到sys.stdout.write标准输出,可以修改参数file,指定输出到文件。

print()是同步阻塞的,所以频繁的print会大大降低程序运行速度,比如在训练模型时注意减少print的次数。

2.id(obj)查看对象内存地址。

3.type(obj)查看对象的类型。

4.round(value, n)四舍五入到小数点后n位。

5.a = input(msg)打印出msg,并从键盘输入一个变量赋值给a,a为str类型。

6.dir(module)查看module模块的工具(方法)。

7.help(math.pow)查看math工具下pow工具的帮助,按q返回交互模式。

使用例子:

  1. # -*- coding:utf-8 -*-
  2. import sys
  3. import math
  4. import time
  5. integer_1 = 1
  6. float_2 = 2.35
  7. string = 'abc'
  8. print(id(integer_1)) #查看内存地址
  9. print(type(integer_1), type(float_2), type(string), sep='|') #查看类型,并用|分割
  10. print(round(float_2)) #四舍五入
  11. print(dir(math)) #查看math下的方法
  12. input_test = input("请输入")
  13. print(input_test, type(input_test)) #输入测试,并打印类型
  14. help(math.pow)

输出:

  1. 94520588557952
  2. <class 'int'>|<class 'float'>|<class 'str'>
  3. 2
  4. ['__doc__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 'degrees', 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'pi', 'pow', 'radians', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'trunc']
  5. 请输入3
  6. 3 <class 'str'>
  7. Help on built-in function pow in module math:
  8. pow(...)
  9. pow(x, y)
  10. Return x**y (x to the power of y).
  11. (END)

二、Python容器:列表、元组、字典与集合

1.列表

1.使用[]list()来创建列表

  1. >>> [1,2,3,4,5] #使用[]创建
  2. [1, 2, 3, 4, 5]
  3. >>> list(12345) #不可迭代报错
  4. Traceback (most recent call last):
  5. File "<stdin>", line 1, in <module>
  6. TypeError: 'int' object is not iterable
  7. >>> list('1,2,3,4,5') #按照字符分割
  8. ['1', ',', '2', ',', '3', ',', '4', ',', '5']
  9. >>> list('12345')
  10. ['1', '2', '3', '4', '5']

如果使用list()是不允许将不可迭代的转换成列表,如果是可迭代的,例如字符串,则会按照字符分割成列表。

2.使用[offset]选取元素,并修改。

  1. >>> l = [1,2,3,4,5]
  2. >>> l[0] #选取
  3. 1
  4. >>> l[0] = 2 #修改
  5. >>> l
  6. [2, 2, 3, 4, 5]
  7. >>> matrix = [[1,2,3], #创建三阶行列式
  8. ... [4,5,6],
  9. ... [7,8,9]]
  10. >>> matrix
  11. [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
  12. >>> matrix[0][0] #和矩阵写法一样,行优先,只不过从0开始
  13. 1

list类似于数组,但数组只有一个类型,而list里面可以包含多个类型。列表的一个重要特征:列表是可以修改的。这种修改,不是复制一个新的,而是在原地进行修改。

3.使用append()extend()扩充列表

列表扩容的函数append()和extend()都是原地修改列表,所以没有返回值,所以不能赋给某个变量。

  1. >>> lst1 = [1,2,3]
  2. >>> lst1.append(["lyx","xyl"])
  3. >>> lst1
  4. [1, 2, 3, ['lyx', 'xyl']] #append的结果
  5. >>> len(lst1)
  6. 4
  7. >>> lst2 = [1,2,3]
  8. >>> lst2.extend(["lyx","xyl"])
  9. >>> lst2
  10. [1, 2, 3, 'lyx', 'xyl'] #extend的结果
  11. >>> len(lst2)
  12. 5

总结以下就是append是整建制地追加,extend是个体化扩编。

4.使用insert()插入,使用del,remove()pop()删除

  1. >>> lst = [1,2,3,4]
  2. >>> lst.insert(0,0)
  3. >>> lst
  4. [0, 1, 2, 3, 4]
  5. >>> lst.insert(3,3.5)
  6. >>> lst
  7. [0, 1, 2, 3.5, 3, 4]
  8. >>> lst.insert(10,5)
  9. >>> lst
  10. [0, 1, 2, 3.5, 3, 4, 5]

使用insert(offset,value),当offset为0时则插入到头部,当offset超过了尾部,则会插入到最后,并不会引起异常。

  1. >>> lst = [1,2,3,4,5]
  2. >>> del lst[0]
  3. >>> lst
  4. [2, 3, 4, 5]
  5. >>> lst.remove(3)
  6. >>> lst
  7. [2, 4, 5]
  8. >>> lst.pop()
  9. 5
  10. >>> lst
  11. [2, 4]

使用del则是删除指定位置的元素,使用remove()则是删除指定值的数,使用pop()则是弹栈操作,返回最后一位元素,即栈顶元素。

5.使用in判断元素是否存在,count()记录特定值出现次数,index()查询具有特定值的元素位置

  1. >>> word = [1,2,3,4,5,1,1,2]
  2. >>> 1 in word
  3. True
  4. >>> 6 in word
  5. False
  6. >>> word.count(1)
  7. 3
  8. >>> word.index(1)
  9. 0
  10. >>> word.index(1,1)
  11. 5
  12. >>> word.index(1,6)
  13. 6

index(str, beg=0, end=len(string)),其中beg规定开始索引,end默认为列表长度,返回开始索引位置后第一次出现的str的位置。

6.使用sort()sorted()排列数组

默认都是升序排列,加上参数reverse=True则降序排列。

  • sort()会对原列表进行排序,改变原列表内容。
  • sorted()则会返回排序好的列表副本,原列表内容不变。
  1. >>> lst = [4,3,2,5,2,1,5,7,0]
  2. >>> lst_copy = sorted(lst)
  3. >>> lst_copy
  4. [0, 1, 2, 2, 3, 4, 5, 5, 7]
  5. >>> lst
  6. [4, 3, 2, 5, 2, 1, 5, 7, 0]
  7. >>> lst.sort()
  8. >>> lst
  9. [0, 1, 2, 2, 3, 4, 5, 5, 7]
  10. >>> lst.sort(reverse=True)
  11. >>> lst
  12. [7, 5, 5, 4, 3, 2, 2, 1, 0]

7.使用=赋值,copy()复制

  1. >>> a = [1,2,3]
  2. >>> b = a
  3. >>> b
  4. [1, 2, 3]
  5. >>> a[0] = 0
  6. >>> b
  7. [0, 2, 3]
  8. >>> c = a.copy() #使用copy()复制
  9. >>> d = list(a) #使用list()函数复制
  10. >>> f = a[:] #使用列表分片
  11. >>> a[0] = 1
  12. >>> c
  13. [0, 2, 3]
  14. >>> d
  15. [0, 2, 3]
  16. >>> f
  17. [0, 2, 3]

即使用=赋值后,b与a是同一个对象,修改任意一个都会修改对方,使用copy(),list()[:]都可以做到创建一个新对象的作用。

8.使用range()生成列表

在Python3中,range()的返回值已经变为range类型,不再是原来的list类型,但依旧可以使用list函数转换过去。range(start, end, step),即生成一个从start开始,end - 1结束的列表,step为步长,多用于循环之中。

  1. >>> range(0,5)
  2. range(0, 5)
  3. >>> type(range(0,5))
  4. <class 'range'>
  5. >>> for i in range(0,5):
  6. ... print(i)
  7. ...
  8. 0
  9. 1
  10. 2
  11. 3
  12. 4
2.元组

1.使用()tuple()创建元组

  1. >>> tup = [1,2,3]
  2. >>> tup = tuple(tup)
  3. >>> tup
  4. (1, 2, 3)
  5. >>> (1,2,3)
  6. (1, 2, 3)
  7. >>> tup[0]
  8. 1
  9. >>> tup[0] = 2
  10. Traceback (most recent call last):
  11. File "<stdin>", line 1, in <module>
  12. TypeError: 'tuple' object does not support item assignment

元组与列表使用方法基本都是相同的,但最大的区别就是一旦创建元组就不能修改,所以所有修改列表的操作元组这里都不能用,dir(tuple)可知,对元组进行操作的只有['count','index']。所以使用场景就是元组的占用空间小,你不会意外修改元组的值和它可以作为字典的键。

3.字典

字典与列表类似,可以原地修改,即它是可变的,但它的顺序无关紧要,因为其本质就是键值对。在字典中的“键”,必须是不可变的数据类型;“值”可以是任意数据类型。

1.使用{}dict()来创建字典

  1. >>> mydict = {"1":"a","2":"b"} #初始化字典
  2. >>> mydict
  3. {'1': 'a', '2': 'b'}
  4. >>> lst = [[1,2],[3,4],[5,6]] #将二维列表转换成字典
  5. >>> mydict = dict(lst)
  6. >>> mydict
  7. {1: 2, 3: 4, 5: 6}
  8. >>> string = ('12','34','56') #将双字符的字符串元组转换成字典
  9. >>> mydict = dict(string)
  10. >>> mydict
  11. {'1': '2', '3': '4', '5': '6'}

2.使用[key]添加或修改元素,使用in判断键是否存在于字典

  1. >>> mydict = {1: 2, 3: 4, 5: 6}
  2. >>> mydict[7] = 8
  3. >>> mydict
  4. {1: 2, 3: 4, 5: 6, 7: 8}
  5. >>> if 2 in mydict:
  6. ... mydict[2] = 0
  7. ... else:
  8. ... mydict[3] = 0
  9. ...
  10. >>> mydict
  11. {1: 2, 3: 0, 5: 6, 7: 8}

3.使用update()合并字典

  1. >>> a = {1:2,3:4}
  2. >>> a
  3. {1: 2, 3: 4}
  4. >>> b = {5:6,7:8}
  5. >>> b
  6. {5: 6, 7: 8}
  7. >>> a.update(b)
  8. >>> a
  9. {1: 2, 3: 4, 5: 6, 7: 8}
  10. >>> c = {1:'a'} #如果使用同样的键,则新归入字典的值会取代原有的值
  11. >>> a.update(c)
  12. >>> a
  13. {1: 'a', 3: 4, 5: 6, 7: 8}

4.使用del删除指定键元素与clear()清空字典

  1. >>> a
  2. {1: 'a', 3: 4, 5: 6, 7: 8}
  3. >>> del a[1]
  4. >>> a
  5. {3: 4, 5: 6, 7: 8}
  6. >>> a.clear()
  7. >>> a
  8. {}

5.使用[key]get()获取元素

  1. >>> a = {1:2,3:4}
  2. >>> a[1]
  3. 2
  4. >>> a[2]
  5. Traceback (most recent call last):
  6. File "<stdin>", line 1, in <module>
  7. KeyError: 2
  8. >>> a.get(1)
  9. 2
  10. >>> a.get(2)

使用[key]获取,如果键不存在则会抛出异常,所以改用get()方法,不存在的话会返回None。

6.使用keys()values()items()

  1. >>> a = {1: 2, 3: 4, 5: 6, 7: 8}
  2. >>> a.keys() #使用keys()返回所有key值
  3. dict_keys([1, 3, 5, 7])
  4. >>> type(a.keys())
  5. <class 'dict_keys'>
  6. >>> list(a.keys())
  7. [1, 3, 5, 7]
  8. >>> a.values() #使用values()返回所有value值
  9. dict_values([2, 4, 6, 8])
  10. >>> a.items() #使用items()返回所有键值对
  11. dict_items([(1, 2), (3, 4), (5, 6), (7, 8)])

我们可以看到,在Python3中,返回的类型已经变成'dict_keys'等等这种方法,这样做的目的是list占用空间较大,且效率不高,所以如果需要用到list,再使用list函数即可。

4.集合

集合的概念与数学中的集合概念是相同的,即集合中的元素是互异的。

1.使用{}set()创建集合

  1. >>> s = {1,2,3,4,1}
  2. >>> s
  3. {1, 2, 3, 4}
  4. >>> a = [1,1,1,2,3,4,3,3,4,5]
  5. >>> s = set(a)
  6. >>> s
  7. {1, 2, 3, 4, 5}

可见,在Python中去重是非常简单的事情,直接转换成集合就行了。

同样也可以使用in来判断一个元素是否存在于集合之中,这里就不在举例。

2.集合中运算

  1. >>> a = {1,2,3}
  2. >>> b = {2,3}
  3. >>> a > b #使用>=与<=判断是否是子集,使用>与<判断是否是真子集
  4. True
  5. >>> a > a
  6. False
  7. >>> a & b #使用&做交集
  8. {2, 3}
  9. >>> a | b #使用|做并集
  10. {1, 2, 3}
  11. >>> a - b #使用-做差集
  12. {1}
  13. >>> b - a
  14. set()
  15. >>> b ^ a #使用^做异或集
  16. {1}
5.进一步的内建函数

1.zip(*iterables),使用它可以做到并行迭代,举例说明:

  1. >>> a = (1,2,3)
  2. >>> b = (4,5,6)
  3. >>> for i,j in zip(a,b):
  4. ... print(i,j)
  5. ...
  6. 1 4
  7. 2 5
  8. 3 6

所以可以使用其进行生成字典操作:

  1. >>> a = (1,2,3)
  2. >>> b = (4,5,6)
  3. >>> dict(zip(a,b))
  4. {1: 4, 2: 5, 3: 6}

2.map(function, iterable, ...),类似于MapReduce中的Map阶段,即将后面的iterable作用于前面的function,举例说明:

  1. >>> def add(x):
  2. ... return x + 10
  3. ...
  4. >>> lst = [1,2,3,4]
  5. >>> map(add, lst)
  6. <map object at 0x000002C359ACC9B0>
  7. >>> list(map(add, lst))
  8. [11, 12, 13, 14]

同样我们可以看到,在Python3中返回的是一个map对象,依旧是节省时间的作用,也就是lazy evaluation

3.enumerate(iterable, start=0),其实就是枚举,具体看下面的例子:

  1. >>> seasons = ['Spring', 'Summer', 'Fall', 'Winter']
  2. >>> list(enumerate(seasons))
  3. [(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]
  4. >>> list(enumerate(seasons, start=1))
  5. [(1, 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')]
6.可变长度的函数参数

在Python中,有两种变长参数,分别是元组(非关键字参数)和字典(关键字参数)。其调用方式是:func( *args, **kwargs )

因为有时候不知道传进去多少个参数,所以要用可变长的参数,在参数前加一个星号*代表传入的参数会被储存为元组,加两个星号**代表传入的会被储存为字典,要使用键值对的方式传入,具体见下例

  1. >>> def print_args(*args):
  2. ... print('tuple',args)
  3. ...
  4. >>> print_args() #如果不传参,则返回空的tuple()
  5. tuple ()
  6. >>> print_args(1,3,12,'asd',[1,2])
  7. tuple (1, 3, 12, 'asd', [1, 2])
  8. >>> def print_kwargs(**kwargs):
  9. ... print('dict',kwargs)
  10. ...
  11. >>> print_kwargs(a='a',b='b',c='c')
  12. dict {'a': 'a', 'b': 'b', 'c': 'c'}

那么这样做有什么用呢?下面举一些例子说明:

  1. #转置一个矩阵
  2. >>> matrix = [[1,2,3],[4,5,6],[7,8,9]]
  3. >>> matrix = list(map(list, zip(*matrix)))
  4. >>> matrix
  5. [[1, 4, 7], [2, 5, 8], [3, 6, 9]]

zip(*value)因为在函数调用中使用*list/tuple的方式表示将list/tuple分开,作为位置参数传递给对应函数,所以起到了转置矩阵的作用。

三、Python高级用法

1.列表推导式

例如我们要创建一个0到10的列表,那么我们可能首先会想到使用range()

  1. >>> list(range(0,11))
  2. [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

然而更加Pythonic的方法是使用列表推导式,即[expression for item in iterable if condition],举例说明

  1. >>> [x for x in range(0,11)]
  2. [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
  3. >>> [x**2 for x in range(0,11)]
  4. [0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
  5. >>> [x**2 for x in range(0,11) if x < 5]
  6. [0, 1, 4, 9, 16]

这里我们可以用它构建一个空的二维数组,即一个m*n的矩阵

  1. >>> [[0 for col in range(5)] for row in range(3)]
  2. [[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]

再举一个例子,取出有相同值的列表中第n次出现的下标

  1. >>> nums = [1,2,3,2,1,3,4,5,6,1,3,5,6,4,2,1]
  2. >>> index = [idx for idx, e in enumerate(nums) if e == 1] #其中idx是下标,1为目标值,即取出了所有1的位置下标
  3. >>> index
  4. [0, 4, 9, 15]
2.匿名函数:lambda()函数

Python中,为实现函数式编程,lambda不能少,它是用于语句表达的匿名函数,可以用来代替小的函数,下面举例说明。

  1. #判断一个数是否是偶数
  2. >>> f = lambda x: True if x % 2 == 0 else False
  3. >>> print(f(4))
  4. True
  5. >>> print(f(5))
  6. False
  1. #字典按values排序
  2. >>> dict = {'four': 4, 'three': 3, 'two': 2, 'one': 1}
  3. >>> dict_lst = sorted(dict.items(), key=lambda x:x[1])
  4. >>> dict_lst
  5. [('one', 1), ('two', 2), ('three', 3), ('four', 4)]
3.日期与时间

使用python处理日期与时间,需要用到datetime模块,例如获取当前时间

  1. >>> from datetime import datetime
  2. >>> now = datetime.now()
  3. >>> print(now)
  4. 2018-01-17 19:55:50.371107

很多时候使用时间戳来表示时间,我们把1970年1月1日 00:00:00 UTC+00:00时区的时刻称为epoch time,记为0(1970年以前的时间timestamp为负数),当前时间就是相对于epoch time的秒数,称为timestamp。

  1. >>> now.timestamp()
  2. 1516190150.371107
  3. #相应的转回来使用
  4. >>> t = now.timestamp()
  5. >>> print(datetime.fromtimestamp(t))
  6. 2018-01-17 19:55:50.371107
  7. #还可以转成UTC时间
  8. >>> print(datetime.utcfromtimestamp(t))
  9. 2018-01-17 11:55:50.371107

然而这些都是datetime类型的数据,不便于处理,所以我们要将其转换成字符串类型,字符串'%Y-%m-%d %H:%M:%S'规定了日期和时间部分的格式。

  1. >>> print(now.strftime('%Y-%m-%d %H:%M:%S'))
  2. 2018-01-17 19:55:50
  3. >>> print(now.strftime('%Y-%m-%d'))
  4. 2018-01-17
  5. >>> print(now.strftime('%Y%m%d'))
  6. 20180117
  7. #当然也可以字符串转datetime
  8. >>> now = now.strftime('%Y%m%d')
  9. >>> now
  10. '20180117'
  11. >>> now = datetime.strptime(now, '%Y%m%d')
  12. >>> now
  13. datetime.datetime(2018, 1, 17, 0, 0)

可以随意调整你需要的格式。

有时我们还会用到时间的运算,这里必须结合datetimetimedelta

  1. >>> from datetime import datetime, timedelta
  2. >>> now = datetime.now()
  3. >>> now
  4. datetime.datetime(2018, 1, 17, 20, 3, 53, 221673)
  5. >>> now + timedelta(hours=1)
  6. datetime.datetime(2018, 1, 17, 21, 3, 53, 221673)
  7. >>> now - timedelta(days=7)
  8. datetime.datetime(2018, 1, 10, 20, 3, 53, 221673)
  9. >>> (now - timedelta(days=7)).strftime('%Y-%m-%d-%H-%M-%S')
  10. '2018-01-10-20-03-53'
  11. >>> (now - timedelta(days=7)).strftime('%Y-%m-%d-%H-%M-%S').split('-')
  12. ['2018', '01', '10', '20', '03', '53']

把分隔符号统一便于分隔,分隔成list后便于进行时间粒度划分处理。

最后一个实用的是判断星期几:

  1. >>> from datetime import datetime
  2. >>> text = '2012-09-20'
  3. >>> y = datetime.strptime(text, '%Y-%m-%d')
  4. >>> y.weekday()
  5. 3
4.高级内建函数

1.reduce(function, iterable[, initializer]),有map当然就会有reduce,在Python3中,reduce()已经从全局命名空间中移除,放到了functools模块中,如果要是用,需要用from functools import reduce引入之。

map是上下运算,reduce是横着逐个元素进行运算,下面举个例子:

  1. #基础用法
  2. >>> reduce(lambda x,y: x+y,[1,2,3,4,5])
  3. 15
  4. #进阶
  5. >>> a = [1,2,3,4,5]
  6. >>> b = [6,7,8,9,10]
  7. >>> list(zip(a,b))
  8. [(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]
  9. >>> sum(x*y for x,y in zip(a,b))
  10. 130
  11. >>> reduce(lambda x,y:x+y,map(lambda x,y:x*y,a,b))
  12. 130

2.filter(function, iterable),filter的中文含义是“过滤器”,在python中,它就是起到了过滤器的作用。

  1. >>> numbers = range(-5,5)
  2. >>> numbers
  3. [-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]
  4. >>> filter(lambda x: x>0, numbers)
  5. [1, 2, 3, 4]
  6. >>> [x for x in numbers if x>0] #与上面那句等效
  7. [1, 2, 3, 4]

3.yield生成器,返回值 变为一个生成器对象

  1. #例如输出斐波那契数列前N个数字
  2. >>> def fab(max):
  3. ... n, a, b = 0, 0, 1
  4. ... while n < max:
  5. ... print(b)
  6. ... a, b = b, a + b
  7. ... n = n + 1
  8. ...
  9. >>> fab(5)
  10. 1
  11. 1
  12. 2
  13. 3
  14. 5
  15. #修改后变为
  16. >>> def fab(max):
  17. ... n, a, b = 0, 0, 1
  18. ... while n < max:
  19. ... yield(b)
  20. ... a, b = b, a + b
  21. ... n = n + 1
  22. ...
  23. >>> fab(5)
  24. <generator object fab at 0x000002C359B6F410>
  25. >>> for i in fab(5):
  26. ... print(i)
  27. ...
  28. 1
  29. 1
  30. 2
  31. 3
  32. 5

这样做的好处是它不是全部存在内存里,它只在要调用的时候在内存里生成,这样就能和上述一样做到lazy evaluation,需要的时候才迭代。

5.文件操作

1.打开文件:

fp = open("test.txt",w)

直接打开一个文件,如果文件不存在则创建文件

关于open 模式:

w 以写方式打开,

a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+ 以读写模式打开

w+ 以读写模式打开 (参见 w )

a+ 以读写模式打开 (参见 a )

2.关闭文件:

使用file.close()或者with open("131.txt","w") as f:来关闭,建议使用第二种操作

  1. >>> with open("131.txt","w") as f:
  2. ... f.write("This is a file")
  3. ...
  4. 14

3.read/readline/readlines

  • read:如果指定了参数size,就按照该指定长度从文件中读取内容,否则,就读取全文。被读出来的内容,全部塞到一个字符串里面。这样有好处,就是东西都到内存里面了,随时取用,比较快捷;也是因为这点,如果文件内容太多了,内存会吃不消的。
  • readline:那个可选参数size的含义同上。它则是以行为单位返回字符串,也就是每次只读一行,依次循环,如果不限定size,直到最后一个返回的是空字符串,意味着到文件末尾了(EOF)。
  • readlines:size同上。它返回的是以行为单位的列表,即相当于先执行readline(),得到每一行,然后把这一行的字符串作为列表中的元素塞到一个列表中,最后将此列表返回。
  1. >>> with open("airport_gz_passenger_24.csv","r") as f:
  2. ... text = f.read()
  3. ...
  4. >>> text = text.split('\n')
  5. >>> text[0]
  6. 'passengerCount,WIFIAPTag,slice10min'
  7. >>> with open("airport_gz_passenger_24.csv","r") as f:
  8. ... f.readline()
  9. ...
  10. 'passengerCount,WIFIAPTag,slice10min\n'
  11. >>> with open("airport_gz_passenger_24.csv","r") as f:
  12. ... text = f.readlines()
  13. ...
  14. >>> text[0]
  15. 'passengerCount,WIFIAPTag,slice10min\n'
5.多进程实现并行处理

在Python中使用multiprocessing模块来实现多进程,下面举例说明

  1. #一个简单的查找程序
  2. import multiprocessing
  3. import time
  4. def find(flag):
  5. num = 99
  6. if flag == 0:
  7. s1 = time.time()
  8. for i in range(0, 101):
  9. time.sleep(0.1)
  10. if num == i:
  11. print("顺序找到")
  12. print("耗时" + str(time.time() - s1))
  13. if flag == 1:
  14. s2 = time.time()
  15. for i in range(101, 0, -1):
  16. time.sleep(0.1)
  17. if num == i:
  18. print("逆序找到")
  19. print("耗时" + str(time.time() - s2))
  20. if __name__ == "__main__":
  21. pool = multiprocessing.Pool(processes = 2)
  22. for i in range(2):
  23. pool.apply_async(find, (i, )) #维持执行的进程总数为processes,当一个进程执行完毕后会添加新的进程进去
  24. print("开始")
  25. pool.close()
  26. pool.join() #调用join之前,先调用close函数,否则会出错。执行完close后不会有新的进程加入到pool,join函数等待所有子进程结束
  27. print("结束")

结果如下:

  1. C:\Users\Cabbage\Desktop\毕业设计\code\first>python mulprocess_1.py
  2. 开始
  3. 逆序找到
  4. 耗时0.30155348777770996
  5. 顺序找到
  6. 耗时10.043102502822876
  7. 结束
6.异常处理

1.错误与异常

语法错误,或者称之为解析错误:

  1. >>> while True print('Hello world')
  2. File "<stdin>", line 1, in ?
  3. while True print('Hello world')
  4. ^
  5. SyntaxError: invalid syntax

异常

即使一条语句或表达式在语法上是正确的,在运行它的时候,也有可能发生错误。在执行期间检测到的错误被称为异常并且程序不会无条件地崩溃:你很快就会知道如何在 Python 程序中处理它们。然而大多数异常都不会被程序处理,导致产生类似下面的错误信息:

  1. >>> 10 * (1/0)
  2. Traceback (most recent call last):
  3. File "<stdin>", line 1, in ?
  4. ZeroDivisionError: division by zero
  5. >>> 4 + spam*3
  6. Traceback (most recent call last):
  7. File "<stdin>", line 1, in ?
  8. NameError: name 'spam' is not defined
  9. >>> '2' + 2
  10. Traceback (most recent call last):
  11. File "<stdin>", line 1, in ?
  12. TypeError: Can't convert 'int' object to str implicitly

最后一行的错误消息指示发生了什么事。异常有不同的类型,下面列出常见异常:

异常 描述
NameError 尝试访问一个没有申明的变量
ZeroDivisionError 除数为0
SyntaxError 语法错误
IndexError 索引超出序列范围
KeyError 请求一个不存在的字典关键字
IOError 输入输出错误(比如你要读的文件不存在)
AttributeError 尝试访问未知的对象属性

2.使用try...except处理异常

抛出异常

可以通过编程来选择处理部分异常。看一下下面的例子,它会一直要求用户输入直到输入一个合法的整数为止,但允许用户中断这个程序(使用Control-C或系统支持的任何方法);注意用户产生的中断引发的是 KeyboardInterrupt 异常。

  1. while True:
  2. try:
  3. x = int(input("输入一个数字: "))
  4. break
  5. except ValueError:
  6. print("这不是数字,重新输入。")

输出为:

  1. C:\Users\Cabbage\Desktop\毕业设计\code\first>python error.py
  2. 输入一个数字: a
  3. 这不是数字,重新输入。
  4. 输入一个数字: b
  5. 这不是数字,重新输入。
  6. 输入一个数字: 1

引发异常

raise语句允许程序员强行引发一个指定的异常。例如:

  1. inputValue = input("请输入a,b或c:")
  2. if inputValue in "abc":
  3. print(inputValue)
  4. else:
  5. raise(ValueError)

结果为:

  1. C:\Users\Cabbage\Desktop\毕业设计\code\first>python raise.py
  2. 请输入a,bc:f
  3. Traceback (most recent call last):
  4. File "raise.py", line 5, in <module>
  5. raise(ValueError)
  6. ValueError
  7. C:\Users\Cabbage\Desktop\毕业设计\code\first>python raise.py
  8. 请输入a,bc:a
  9. a

一天速成Python教程的更多相关文章

  1. 《简明python教程》笔记一

    读<简明Python教程>笔记: 本书的官方网站是www.byteofpython.info  安装就不说了,网上很多,这里就记录下我在安装时的问题,首先到python官网下载,选好安装路 ...

  2. Python教程:连接数据库,对数据进行增删改查操作

    各位志同道合的同仁可以点击上方关注↑↑↑↑↑↑ 本教程致力于程序员快速掌握Python语言编程. 本文章内容是基于上次课程Python教程:操作数据库,MySql的安装详解 和python基础知识之上 ...

  3. Python教程:操作数据库,MySql的安装详解

    各位志同道合的同仁请点击上方关注 本教程是基于Python语言的深入学习.本次主要介绍MySql数据库软件的安装.不限制语言语法,对MySql数据库安装有疑惑的各位同仁都可以查看一下. 如想查看学习P ...

  4. (原+转)简明 Python 教程:总结

     简明 Python 教程 说明:本文只是对<简明Python教程>的一个总结.请搜索该书查看真正的教程. 第3章 最初的步骤 1. Python是大小写敏感的. 2. 在#符号右面的内容 ...

  5. Python教程百度网盘哪里有?

    Python为我们提供了非常完善的基础代码库,覆盖了网络.文件.GUI.数据库.文本等大量内容,被形象地称作"内置电池(batteries included)".带你快速入门的Py ...

  6. 2017最新的Python教程分享

    Python在数据科学盛行的今天,其易于阅读和编写的特点,越来越受编程者追捧.在IEEE发布的2017年编程语言排行榜中,Python也高居首位.如果你有学Python的计划,快来看看小编分享的Pyt ...

  7. 笔记|《简明Python教程》:编程小白的第一本python入门书

    <简明Python教程>这本书是初级的Python入门教材,初级内容基本覆盖,对高级内容没有做深入纠结.适合刚接触Python的新手,行文比较简洁轻松,读起来也比较顺畅. 下面是我根据各个 ...

  8. 简明的Python教程中的几个疑惑点分析#2

    #1简明的Python教程当中第十四章Python标准库介绍中的使用sys模块 假如你没看懂sys模块这一章节,那么没关系,看下面一段代码再看简明的Python教程中的sys模块实例你将很容易看懂 代 ...

  9. 简明的Python教程当中的几个疑惑点分析#1

    #1简明的Python教程中的第11章面向对象编程学习中的类与对象的方法里面 有这么一个案例:使用类与对象的变量 #coding:utf-8 #类与对象的变量学习 class Person: popu ...

随机推荐

  1. Invalid package name:a digit canno be the first character in a package segme

    发现网上没有关于这个的解决方法 其实这个原因是因为下图红框里的是数字 把默认的这个直接删掉,用英语随便输入一个即可

  2. Educational Codeforces Round 78 (Rated for Div. 2)B. A and B(1~n的分配)

    题:https://codeforces.com/contest/1278/problem/B 思路:还是把1~n分配给俩个数,让他们最终相等 假设刚开始两个数字相等,然后一个数字向前走了abs(b- ...

  3. hibernate中session.flush()

    flush()session flush在commit之前默认都会执行, 也可以手动执行,他主要做了两件事: 1) 清理缓存. 2) 执行SQL. flush: Session 按照缓存中对象属性变化 ...

  4. Django模型迁移提示版本不匹配解决办法

    Django迁移模型时提示django.core.exceptions.ImproperlyConfigured:mysqlclient 1.3.7 or newer is required; you ...

  5. xianduanshu

    https://www.cnblogs.com/xenny/p/9739600.html ***************https://blog.csdn.net/shiqi_614/article/ ...

  6. 导入import的多种形式

    参考资料:anaconda官方资料 一.module(模块) 比如fibo是个模块(.py文件),其中有fib.fib2等函数 第一种形式:import fibo 在当前的符号表中,这并不会直接进入到 ...

  7. rest framework-认证&权限&限制-长期维护

    ###############   自定义token认证    ############### 表 class User(models.Model): name=models.CharField(ma ...

  8. left join on注意点

    右侧表的条件参数需要放在on后面 where 后面进放置左表的条件参数 比如消息表和用户消息表 消息表里存在类型为<系统消息>的消息是发送给全部用户 我们发送给系统消息时,不直接插入用户消 ...

  9. 国内外主流的三维GIS软件

    我国GIS经过三十多年的发展,理论和技术日趋成熟,在传统二维GIS已不能满足应用需求的情况下,三维GIS应运而生,并成为GIS的重要发展方向之一.上世纪八十年代末以来,空间信息三维可视化技术成为业界研 ...

  10. 树状数组 hdu2689 hdu2838

    题意:给定一个正整数n,和一个1-n的一个排列,每个数可以和旁边的两个数的任意一个交换,每交换一次总次数就要加一,问将这个排列转换成一个递增的排列需要多少次交换? 题意可以转换成求这个排列的逆序对数. ...