写爬虫爬了3w条职位数据，看看当前招聘形势

最近有不少程序员又开始找工作了，为了了解目前技术类各职位的数量、薪资、招聘公司、岗位职责及要求，我爬取了拉勾网北上广深4个城市的招聘数据，共3w条。职位包括：人工智能（AI）、大数据、数据分析、后端（Java、C|C++、PHP、Python）、前端、Android、iOS、嵌入式和测试。从数据爬取到分析用了两天的时间，不论你是在职状态还是找工作的状态，相信这份数据都会对你有参考价值。另外，在公众号（见文末）回复职位即可获得本次分析的源码。

1、哪个城市目前招聘的岗位多

可以看到，目前北京招聘的岗位最多，其次是上海和深圳，广州是最少的。

2、每个城市各岗位的需求量

北上广深4个城市目前招聘较多的岗位主要是后端-Java、前端、AI和测试。

3、各岗位的平均薪资情况

AI岗位的薪资最高，平均每个月30k以上；其次是大数据岗位，平均每个月26k左右，iOS的平均薪资比Android稍微高一些。另外，目前的前端岗位平均薪资偏低。

4、几年工作经验比较吃香

以北京招聘数据为例，目前招聘的各岗位都是以3-5年工作经验为主，1-3年经验的需求量不大。所以，这里也要提醒职场新人，不要轻易跳槽。

其他城市的分布情况与北京类似，这里就不贴图了。

5、什么学历比较吃香

以北京为例，目前招聘的岗位除了AI需要不少的硕士甚至博士外，其他岗位以本科学历为主。

其他城市分布与北京类似。

6、什么规模公司对岗位需求大

北京

广州

可以看到，北京招聘的企业主要是2000人以上规模的大公司，上海和深圳的分布与北京类似。而广州在AI、前端和后端-Java几个岗位的招聘主要以50-1000人的中等规模公司为主。

7、HR什么时间段更活跃

以北京为例，各岗位的HR大部分在下午活跃，所以大家可以将简历的投递时间选在下午。

其他城市分布与北京类似。

8、岗位的职责和要求

限于篇幅，我只跑了AI、后端-Java和前端这3个岗位的数据，以词云的形式展现

希望这次分析能对你有用，欢迎公众号「渡码」，回复关键字“职位”即可获取本次分析的源码。

写爬虫爬了3w条职位数据，看看当前招聘形势 | 开源的更多相关文章

爬虫黑科技，我是怎么爬取indeed的职位数据的
最近在学习nodejs爬虫技术,学了request模块,所以想着写一个自己的爬虫项目,研究了半天,最后选定indeed作为目标网站,通过爬取indeed的职位数据,然后开发一个自己的职位搜索引擎,目前 ...
Python写爬虫-爬甘农大学校新闻
Python写网络爬虫(一) 关于Python: 学过C. 学过C++. 最后还是学Java来吃饭. 一直在Java的小世界里混迹. 有句话说: "Life is short, you ne ...
用Python写爬虫爬取58同城二手交易数据
爬了14W数据,存入Mongodb,用Charts库展示统计结果,这里展示一个示意模块1 获取分类url列表 from bs4 import BeautifulSoup import request ...
Python写爬虫爬妹子
最近学完Python,写了几个爬虫练练手,网上的教程有很多,但是有的已经不能爬了,主要是网站经常改,可是爬虫还是有通用的思路的,即下载数据.解析数据.保存数据.下面一一来讲. 1.下载数据首先打 ...
ruby 爬虫爬取拉钩网职位信息，产生词云报告
思路:1.获取拉勾网搜索到职位的页数 2.调用接口获取职位id 3.根据职位id访问页面,匹配出关键字 url访问采用unirest,由于拉钩反爬虫,短时间内频繁访问会被限制访问,所以没有采用多线程, ...
Python3爬虫爬取淘宝商品数据
这次的主要的目的是从淘宝的搜索页面获取商品的信息.其实分析页面找到信息很容易,页面信息的存放都是以静态的方式直接嵌套的页面上的,很容易找到.主要困难是将信息从HTML源码中剥离出来,数据和网页源码结合 ...
python学习（十六）写爬虫爬取糗事百科段子
原文链接:爬取糗事百科段子利用前面学到的文件.正则表达式.urllib的知识,综合运用,爬取糗事百科的段子先用urllib库获取糗事百科热帖第一页的数据.并打开文件进行保存,正好可以熟悉一下之前学过 ...
Python爬虫爬取豆瓣电影之数据提取值xpath和lxml模块
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统.谷歌浏览器目的:爬取豆瓣电影排行榜中电影的title.链接地址.图片.评价人数.评分等网址:https:// ...
Python爬虫爬取百度翻译之数据提取方法json
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ...

随机推荐

Qt类声明中Q_OBJECT的作用与报错解决
2017-06-22 周四大雨北京院里新建作图类,继承自QCUstomPlot类因为需要同时作8张图,都要单坐标缩放的功能,因此想干脆新建一个类,继承自QCUstomPlot,把需要的功能都 ...
jquery和zepto的异同
相同点相同点: zepto: 是jquery 的阉割版是为移动端开发的库 jQuery的轻量级替代品.文件大小比较小只有8k左右 ,是目前功能库中最小的一个,尽管不大,zepto 所提供的工具 ...
vagrant 虚拟机配置最佳实践
Mac VirtualBox Vagrant 管理虚拟机这篇文章定位是在理解了 vagrant 相关概念之后,教你如何灵活玩转自己的虚拟机配置本文为 @favoorr 常用的 Mac Virtua ...
深度解析互联网大厂面试难题自定义@EnableXX系列
深度解析互联网大厂面试难题自定义@EnableXX系列其实是一个@Import的设计技巧创建注解@EnableXX(任何名称注解都行,只是这个名字好一些) XXConfiguration类不能 ...
前端每日实战：119# 视频演示如何用纯 CSS 创作一个接扎啤的动画（内含2个视频）
效果预览按下右侧的"点击预览"按钮可以在当前页面预览,点击链接可以全屏预览. https://codepen.io/comehope/pen/rZeOQp 可交互视频此视频是可 ...
Could not find a valid gem 'redis' (= 0)
Could not find a valid gem 'redis' (= 0) 报错详情如下: ERROR: Could not find a valid gem 'redis' (>= 0) ...
yuchuan_Linux_C 编程之七系统IO函数
一.整体大纲二. 系统IO函数 1. 一些概念文件描述符 PCB C库函的IO缓冲区 1) 文件描述符 int 类型一个进程最多 ...
Element-UI饿了么时间组件控件按月份周日期，开始时间结束时间范围限制参数
在日常开发中,我们会遇到一些情况,在使用Element-UI 限制用户的日期时间范围的选择控制(例如:查询消息开始和结束时间,需要限制不能选择今天之后的时间). 看了网上的一些文档,零零散散.各式各样 ...
java后台生成并下载二维码
这个功能在项目开发中是很基础的,平时用到的也很多,这里简单记录一下,以便以后使用的时候参考前提业务要求:前台页面展示数据,有下载按钮,点击下载,下载对应数据的二维码. 首先,在pom.xml文件中添 ...
MySQL数据备份之逻辑备份工具mysqldump
#前言:我们知道对数据进行备份很重要,出现非正常操作可以进行对数据进行恢复,下面我们就来使用一下mysql数据库自带的一个逻辑备份工具mysqldump 1.简单概述 #mysqldump:mysql ...

写爬虫爬了3w条职位数据，看看当前招聘形势 | 开源

写爬虫爬了3w条职位数据，看看当前招聘形势 | 开源的更多相关文章

随机推荐

热门专题