我们在之前的文章谈到了高效爬虫 在 python 中 多线程下的 GIL 锁会让多线程显得有点鸡肋 特别是在 CPU 密集型的代码下 多线程被 GIL 锁搞得效率不高 特别是对于多核的 CPU 来说 如果想要充分利用 CPU 还是用多进程吧 这样我们就可以做到并行爬取 提高了爬取的效率 那么,怎么玩多进程呢 恩 接下来就是 学习 python 的正确姿势 可以使用 multiprocessing 来实现多进程 使用起来也是很简单的 比如我们使用 Process 这个类来创建进程 from mul
pc版大概有500条记录,mobile大概是50部,只有热门的,所以少一点 url构造很简单,主要参数就是page_limit与page_start,每翻一页,start+=20即可,tag是"美剧"编码后的结果,直接带着也可以,用unquote解码也可以,注意headers中一定要带上refer import json import requests import math import os import shutil from pprint import pprint from