本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding:utf-8from com.wenhy.crawler_baidu_baike import url_manager, html_downloader, html_parser, html_outputerprint "爬虫百度百科调度入口"# 创建爬虫类class SpiderMain(…
在python 中,主要的常用数据类型有列表,元组,字典,集合,字符串.对于这些基础知识,应该要能够足够熟练掌握. 如何创建列表: # 创建一个空列表:定义一个变量,然后在等号右边放一个中括号,就创建了一个空列表. a1=[] # 创建一个有元素的列表:定义一个变量,然后在中括号中放入元素. #元素是什么样的不规定,但如果是字符或则字符串等,需要加英文的引号,双引号也行,如果是数字,就不用引号. # 注意:所有的标点符号一定是英文状态下的. a2=['a','b','abc',1,2,'abc1…
摘要:主要涉及新数据类型set集合.三元运算.深浅拷贝.函数基础.全局变量与局部变量 一.set --> 无序,不允许重复的集合 不允许重复的列表,   1,创建    s = set() 接收一个可迭代参数      l = [11,22,11,22] s = set(l) --> print s --> {11,22}    s = {11,22,33}     创建空集合 默认使用 s = set()   2,方法    .add()  添加一个元素    .clear()    …
1.面向对象的概念 拥有共同属性的一类进行归类的过程叫做面向对象. 2.注意事项 class定义类的时候,类名的首字母必须大写 3.面向对象案例 1 class Person(object): 2 def __init__(self,name,age): #name,age可以理解为类的属性:init为初始化:类里定义的函数称为构造方法/构造函数 3 self.name=name #实例属性 4 self.age=age 5 print("start") 6 def __del__(s…
字符串是python中使用频率很高的一种数据类型,内置方法也是超级多,对于常用的方法,还是要注意掌握的. #author: Administrator #date: 2018/10/20 # python3 '''字符串的内置方法''' '''字符串的这些方法很重要''' st='hello kitty {name} is {age}' #创建一个字符串. print(st.count('{')) #计数 print(st.capitalize()) #把字符串的第一个字母大写,整个字符串的首字…
元组与列表的方法基本一样,只不过创建元组是用小括号()把元素括起来,两者的区别在于,元组的元素不可被修改. 元组被称为只读列表,即数据可以被查询,但不能被修改,列表的切片操作适用于元组. 元组写在小括号里,元素之间用逗号隔开. Tup1=();               空元组 Tup2=(12,);         元组只有一个元素时,后面最好加一个逗号. 当修改元素时: # 元组不能被修改,只能查询 a=(1,2,3,4,3) a[2]=5 # b=a.index(3) print(a)…
1.声明变量 # 声明一个变量name用来存储一个字符串'apollo' name = 'apollo' # 声明一个变量age用来存储一个数字20 age = 20 # 在控制台打印变量name中存储的字符串和变量age中存储的数字 # 打印结果:apollo 20 print(name,age) # 在控制台打印字符串"name"和"age" print('name','age') # 打印结果:name age 2.控制台交互 username = input…
列表 list 类 中提供的方法 li=[1,5,dhud,dd,] 通过list类创建的对象 中括号括起来 逗号分隔每个元素 列表中的元素可以是数字,字符串,也可以是列表,也可以是布尔值 所有的都能放进去 列表可以无限嵌套 就是一个"集合",内部放置任何东西 索引取值 print( li [ 3 ] ) 切片取值 print( li[3:5]) 切片取值也是列表 列表 可以被索引取值的方法和切片的方法 修改元素 支持in操作 判断元素是否在列表里面 删除第一种方式 del lip[1…
Python基础知识(三) 一丶整型 #二进制转成十进制的方法 # 128 64 32 16 8 4 2 1 1 1 1 1 1 1 例如数字5 : 101 #十进制转成二进制的方法 递归除取余数,从底向上 #十进制:5 5%2==1…
Python基础知识 一.初识基本数据类型 类型: int(整型) 在32位机器上,整数的位数为32位,取值范围为-2**31-2**31-1,即-2147483648-2147483647 在64位系统上,整数的位数为64位,取值范围为-2**63-2**63-1,即-9223372036854775808-9223372036854775807 long(长整型) 跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长…