python 爬去拉钩测试招聘信息

代码如下：

 #coding:utf-8

 import time

 import urllib.request

 from bs4 import BeautifulSoup

 file=open(r'meituancde.txt','w')

 def get_url(i):

     url='https://www.lagou.com/zhaopin/ceshi/%s/?filterOption=%s'%(i,i)

     return url

 def get_html(i):

     headers={

         'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'

         }

     response=urllib.request.Request(url=get_url(i),headers=headers)

     html=urllib.request.urlopen(response).read().decode('utf-8')

     sopu=BeautifulSoup(html)

     return sopu

 def parse(i):

     soup=get_html(i)

     me=soup.findAll('',{'class':'money'}) #工资

     me1=soup.findAll('',{'class':'format-time'})#发布时间

     me2=soup.findAll('',{'class':'li_b_r'})#福利

     me3=soup.findAll('',{'data-lg-tj-id':'8F00'})#公司名字

     meitu={}

     i=0

     for title in me:

         meitu['gongzi'] =me[i].text

         for jianjie in me1:

             meitu['发布时间']=me1[i].text

             for sellum in me2:

                 meitu['福利']=me2[i].text

                 for pire in me3:

                     meitu['公司名称']=me3[i].text

         i+=1

         print(meitu)

         if len(meitu) !=0:

             file.write(str(meitu))

             file.write("\n")

             file.close

 if __name__ == '__main__':

     for i in range(1,31):
         parse(i)

结果图：

python 爬去拉钩测试招聘信息的更多相关文章

用Python爬取智联招聘信息做职业规划
上学期在实验室发表时写了一个爬取智联招牌信息的爬虫. 操作流程大致分为:信息爬取——数据结构化——存入数据库——所需技能等分词统计——数据可视化 1.数据爬取 job = "通信工程师&qu ...
python爬取实习僧招聘信息字体反爬
参考博客:http://www.cnblogs.com/eastonliu/p/9925652.html 实习僧招聘的网站采用了字体反爬,在页面上显示正常,查看源码关键信息乱码,如下图所示: 查看网页 ...
用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
python爬取智联招聘职位信息（多进程）
测试了下,采用单进程爬取5000条数据大概需要22分钟,速度太慢了点.我们把脚本改进下,采用多进程. 首先获取所有要爬取的URL,在这里不建议使用集合,字典或列表的数据类型来保存这些URL,因为数据量 ...
python之scrapy爬取某集团招聘信息以及招聘详情
1.定义爬取的字段items.py # -*- coding: utf-8 -*- # Define here the models for your scraped items # # See do ...
python爬取智联招聘职位信息（单进程）
我们先通过百度搜索智联招聘,进入智联招聘官网,一看,傻眼了,需要登录才能查看招聘信息没办法,用账号登录进去,登录后的网页如下: 输入职位名称点击搜索,显示如下网页: 把这个URL:https://s ...
python之crawlscrapy爬取某集团招聘信息以及招聘详情
针对这种招聘信息,使用crawlscrapy很适合. 1.settings.py # -*- coding: utf-8 -*- # Scrapy settings for gosuncn proje ...
node.js 89行爬虫爬取智联招聘信息
写在前面的话, .......写个P,直接上效果图.附上源码地址 github/lonhon ok,正文开始,先列出用到的和require的东西: node.js,这个是必须的 request,然发 ...
Python 爬取腾讯招聘职位详情 2019/12/4有效
我爬取的是Python相关职位,先po上代码,(PS:本人小白,这是跟着B站教学视频学习后,老师留的作业,因为腾讯招聘的网站变动比较大,老师的代码已经无法运行,所以po上),一些想法和过程在后面. f ...

随机推荐

Foundation框架中日期的操作
#import <Foundation/Foundation.h> int main(int argc, const char * argv[]) { NSDate *date1=[NSD ...
Teredo Tunnel Adapter: Error Code 10
Teredo Tunneling 该设备无法启动错误代码 ErrCode:10 解决方法前文: Win7 系统,打算开启IPV6,本地连接的网络 ip6 驱动是异常的,先重新安装了网卡驱动. 过程 ...
小白关于python 对象和内存的关系的一些感悟和疑惑，望大神指教
首先你输入了一个字符串,这个字符串是有大小的,电脑将其放在内存中,自动给其一个起始指针指向这个字符串的首位置,然后,你将这个字符串赋值给一个变量,这个对象又在内存中开辟出一个空间,这个变量会自动连接这 ...
Java面试常见算法题
1.实现字符串反转提供七种方案实现字符串反转 import java.util.Stack; public class StringReverse { public static String re ...
51Nod 1090 3个数和为0 set 二分优化
给出一个长度为N的无序数组,数组中的元素为整数,有正有负包括0,并互不相等.从中找出所有和 = 0的3个数的组合.如果没有这样的组合,输出No Solution.如果有多个,按照3个数中最小的数从小到 ...
深入理解php内核编写扩展 I：介绍PHP和Zend
内容: 编写扩展I - PHP和Zend起步原文:http://devzone.zend.com/public/view/tag/Extension Part I: Introduction to ...
Hashtable 小记
Hashtable 是 JDK 中较早的数据结构了,目前已不再推荐使用了.但抱着学习的目的,还是看了下它的实现. 简介 Hashtable,顾名思义即哈希表,是一种经典的数据结构.其基本结构是一个数组 ...
教你如何用 lib-flexible 实现移动端H5页面适配
前话好久没写教程了(可能会误导新手的菜鸟教程(￣▽￣)"). 这是我的github,欢迎前端大大们和我一起学习交流 https://github.com/pwcong 最近入职公司做前端实 ...
阿里云轻量应用服务器Lamp部署php工程踩过的坑
第一次写博客,也不知道写什么,但是想坚持写博客来提升自己,不喜勿喷. 切回正题,使用阿里云的轻量应用服务器Lamp其实非常方便,价格也很便宜,一键购买需要的环境都帮你搭配好了,剩下的就是自己修改一下数 ...
iscroll使用之页面卡顿问题
最近在开发项目时,遇到一个问题,使用iscroll实现的页面滚动,测试时发现在chrome浏览器中的模拟移动设备页面不能平滑滚动,有卡顿现象,在android手机端也有同样的问题. 在github上搜 ...

python 爬去拉钩测试招聘信息

python 爬去拉钩测试招聘信息的更多相关文章

随机推荐

热门专题