python网络爬虫笔记（三）

一、切片和迭代

1、列表生成式

2、生成器的generate，但是generate保存的是算法，所以可以迭代计算，没有必要，每次调用generate

二、iteration 循环

1、凡是作用于for循环的对象都是Iterable的类型；凡是作用于next()函数的对象都是Iteratior类型，表示一个惰性计算的序列; 集合数据类型list dict str 是iterable 但不是Iteratior对象。python d的for循环就是不断地调用next() 函数实现。

这里要说明的一点就是 list dict str 虽然不是Iterator 但是是Iterable 把他们变成Iterator可以使用iter() 函数

2、函数式编程和函数编程不是同一回事。 functional programming 其思想更接近于数学的思想计算，高阶函数 Higher-orderfunction

由于'score'没有被放到__slots__中，所以不能绑定score属性，试图绑定score将得到AttributeError的错误。

使用__slots__要注意，__slots__定义的属性仅对当前类实例起作用，对继承的子类是不起作用的：

3、python内置的装饰器@property 负责将一个方法编程属性的调用

4、python函数内建了map（）和reduce（）函数，

map()函数接受两个参数，一个是函数一个是Iterable ，map将传入的函数依次作用到序列的每个元素，并并把结果作为新的Iterabor返回

reduce（）函数，reduce把一个函数作用在一个序列[x1, x2, x3, ...]上，这个函数必须接收两个参数，reduce把结果继续和序列的下一个元素做累积计算，

Python内建的filter()函数用于过滤序列。

和map()类似，filter()也接收一个函数和一个序列。和map()不同的是，filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。

python网络爬虫笔记（三）的更多相关文章

Python网络爬虫笔记（五）：下载、分析京东P20销售数据
(一) 分析网页下载下面这个链接的销售数据 https://item.jd.com/6733026.html#comment 1. 翻页的时候,谷歌F12的Network页签可以看到下面 ...
python网络爬虫（三）requests库的13个控制访问参数及简单案例
酱酱~小编又来啦~
[Python]网络爬虫（三）：异常的处理和HTTP状态码的分类
先来说一说HTTP的异常处理问题. 当urlopen不能够处理一个response时,产生urlError. 不过通常的Python APIs异常如ValueError,TypeError等也会同时产 ...
Python网络爬虫第三弹《爬取get请求的页面数据》
一.urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求.其常被用到的子模块在Python3中的为urllib.request和urllib. ...
Python网络爬虫实战(三)照片定位与B站弹幕
之前两篇已经说完了如何爬取网页以及如何解析其中的数据,那么今天我们就可以开始第一次实战了. 这篇实战包含两个内容. * 利用爬虫调用Api来解析照片的拍摄位置 * 利用爬虫爬取Bilibili视频中的 ...
python网络爬虫第三弹(<爬取get请求的页面数据>)
一.urllib库 urllib是python自带的一个用于爬虫的库,其主要作用就是通过代码模拟浏览器发送请求,其常被用到的子模块在 python3中的为urllib.request 和 urllib ...
python网络爬虫笔记（九）
4.1.1 urllib2 和urllib是两个不一样的模块 urllib2最简单的就是使用urllie2.urlopen函数使用如下 urllib2.urlopen(url[,data[,timeo ...
Python网络爬虫笔记（四）：使用selenium获取动态加载的内容
(一) 说明上一篇只能下载一页的数据,第2.3.4....100页的数据没法获取,在上一篇的基础上修改了下,使用selenium去获取所有页的href属性值. 使用selenium去模拟浏览器有点 ...
Python网络爬虫笔记（一）：网页抓取方式和LXML示例
(一) 三种网页抓取方法 1. 正则表达式: 模块使用C语言编写,速度快,但是很脆弱,可能网页更新后就不能用了. 2. Beautiful Soup 模块使用Python编写,速度慢. ...

随机推荐

个人经验~mongo故障处理思路
一简介:mongodb 应该如何排查二分析角度 linux 角度 1 硬件是否有问题常见主板 raid卡和raid磁盘组 2 综合指标负载 uptime : 1min 5mi ...
解释下面URL
解释下面URL各部分的含义 a.duke.csc.villanova.edu/jss/examles.html duke是计算机名,该计算机属于villanova.edu域的csc子域.edu是最高级 ...
微信小程序学习过程
1.诞生背景: 更好的体验: 规范与管理: 2.什么是小程序: 小程序是一种不需要下载即可使用的应用,它实现了应用“触手可及”的梦想: 用户扫一扫或者搜一下即可打开应用,也体现了“用完即走”的理念: ...
Django之Bootstrap使用
首先将bootstrap文件粘贴到static文件夹中,引入分为两部分,一是css文件引入,二是js文件引入. 1.css引入: <!DOCTYPE html> <html lang ...
python set 使用
创建集合set python set类是在python的sets模块中,大家现在使用的python2.7.x中,不需要导入sets模块可以直接创建集合.>>>set('boy')se ...
HDOJ 3308 LCIS （线段树）
题目: Problem Description Given n integers.You have two operations:U A B: replace the Ath number by B. ...
c++从文件路径获取目录
场景 c++从文件路径获取目录实现代码初始化是不正确的,因为需要转义反斜杠: string filename = "C:\\MyDirectory\\MyFile.bat"; ...
AMBA总线协议AHB、APB、AXI对比分析【转】
转自:https://blog.csdn.net/ivy_reny/article/details/56274412 一.AMBA概述 AMBA (Advanced Microcontrolle ...
Session、LocalStorage、SessionStorage、Cache-Ctrol比较
1.Session Session是什么? 服务器通过 Set-Cookie给用户一个sessionIdsessionId对应服务器内的一小块内存每次用户访问服务器的时候,服务器就听过Sessio ...
转-4年！我对OpenStack运维架构的总结
4年!我对OpenStack运维架构的总结原创: 徐超云技术之家今天前言应“云技术社区”北极熊之邀,写点东西.思来想去云计算范畴实在广泛,自然就聊点最近话题异常火热,让广大云计算从业者爱之深 ...

python网络爬虫笔记（三）

python网络爬虫笔记（三）的更多相关文章

随机推荐

热门专题