项目简介 利用scrapy抓取51job上的python招聘信息,关键词为“python”,范围:全国 利用redis的set数据类型保存抓取过的url,现实避免重复抓取: 利用脚本实现每隔一段时间,网站更新后自动抓取: 利用mongo和mysql,分别保存抓取结果. 主要内容 网站分析 进入51job后,输入关键字python,搜索范围改为全国,通过分析得到该网页为静态网页 搜索后生成的url即为开始抓取的url:https://search.51job.com/list/000000,000…