我用 Python 爬了智联“北上广深”5400条 Java 招聘数据
结论
国际惯例,先上结论。
- Java 类职位招聘,不论是需求量(工作机会),还是工资平均水平,都是帝都北京最好。
- 北京和上海的平均工资差距不大(不超过200/月),但上海的需求量是北京的一半,机会更少。
- 广州和深圳的工作机会几乎一样,平均工资也相差不大。
- 本数据取自 2017 年 4 月 29 号 19 点智联招聘北上广深 90 页招聘数据。收智联排序影响, 可能会有偏差(估计不大)。
- 本数据进攻个人学习只用,如有冒犯,告知立删。
excel文件下载地址http://pan.baidu.com/s/1c19KaFA
数据简介
数据获取时间:2017年4月29号19点。
数据来源:智联招聘。
城市:北京,上海,广州,深圳。
数据范围: 90
页 5401
条 Java
招聘数据。
分析
北上广深所有Java相关的招聘数据共 5400
条。其中:
- 北京
2817
条,占 53% - 上海
1077
条,占 19% - 广州
756
条,占 14% - 深圳
750
条,占 14%
数据表明:
- 北京的 Java 相关工作需求最高,深圳和广州最低,且两城市相差不大。
- 北京占四城市 Java 类工作总需求量的
50%
以上。
北上广深工资均值:
——- | 北京 | 上海 | 广州 | 深圳 |
---|---|---|---|---|
最低平均 | 10158.43 | 10250.81 | 7461.63 | 9006.12 |
最高平均 | 15341.06 | 15667.92 | 11562.32 | 14459.37 |
数据表明:
- 北京和上海的平均工资最高,且两城市相差不大。
- 广州和的平均工资最低。
- 最低工资在广州,(平均)值是
7461.63
元。
北上广深工资最值:
——— | 北京 | 北京 | 上海 | 上海 | 广州 | 广州 | 深圳 | 深圳 |
---|---|---|---|---|---|---|---|---|
最小工资值 | 1000 | 1800 | 1000 | 2000 | 1000 | 2000 | 2001 | 4000 |
最大工资值 | 100001 | 150000 | 100001 | 150000 | 100001 | 150000 | 30001 | 50000 |
数据表明:
- 深圳的最小工资值是最高的。
- 北上广的最高工资值是一样的。
- 深圳的最高工资值是最低的,但个人觉得这不具备统计学价值,因为能达到这个工资的人才,都 有自己获得工作的渠道。
个人觉得最值不具备统计价值。
我用 Python 爬了智联“北上广深”5400条 Java 招聘数据的更多相关文章
- 用Python爬取智联招聘信息做职业规划
上学期在实验室发表时写了一个爬取智联招牌信息的爬虫. 操作流程大致分为:信息爬取——数据结构化——存入数据库——所需技能等分词统计——数据可视化 1.数据爬取 job = "通信工程师&qu ...
- python爬取智联招聘职位信息(多进程)
测试了下,采用单进程爬取5000条数据大概需要22分钟,速度太慢了点.我们把脚本改进下,采用多进程. 首先获取所有要爬取的URL,在这里不建议使用集合,字典或列表的数据类型来保存这些URL,因为数据量 ...
- python爬取智联招聘职位信息(单进程)
我们先通过百度搜索智联招聘,进入智联招聘官网,一看,傻眼了,需要登录才能查看招聘信息 没办法,用账号登录进去,登录后的网页如下: 输入职位名称点击搜索,显示如下网页: 把这个URL:https://s ...
- python爬虫实战之爬取智联职位信息和博客文章信息
1.python爬取招聘信息 简单爬取智联招聘职位信息 # !/usr/bin/env python # -*-coding:utf-8-*- """ @Author ...
- 用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
- Python 爬取途虎养车 全系车型 轮胎 保养 数据
Python 爬取途虎养车 全系车型 轮胎 保养 数据 2021.7.27 更新 增加标题.发布时间参数 demo文末自行下载,需要完整数据私聊我 2021.2.19 更新 增加大保养数据 2020. ...
- 用python+selenium获取北上广深成五地PM2.5数据信息并按空气质量排序
从http://www.pm25.com/shenzhen.html抓取北京,深圳,上海,广州,成都的pm2.5指数,并按照空气质量从优到差排序,保存在txt文档里 代码如下: #coding=utf ...
- 为什么现在很多年轻人愿意来北上广深打拼,即使过得异常艰苦,远离亲人,仍然义无反顾? 谈谈程序员返回家乡的创业问题 利基市场就是那些不大不小的缝隙中的市场 马斯洛的需求无层次不适合中国。国人的需求分三个层次——生存、稳定、装逼。对应的,国内的产品也分三个层次——便宜、好用、装B。人们愿意为这些掏钱
信念.思考.行动-谈谈程序员返回家乡的创业问题 昨天晚上在微博上看了篇 <为什么现在很多年轻人愿意来北上广深打拼,即使过得异常艰苦,远离亲人,仍然义无反顾?>,有些话想说. 感觉很多人的担 ...
- 【转帖】5G基站建设下的“中国速度”:北上广深领跑全国,均超1万个
5G基站建设下的“中国速度”:北上广深领跑全国,均超1万个 https://www.laoyaoba.com/html/news/newsdetail?source=pc&news_id=73 ...
随机推荐
- 【iOS系列】-iOS查看沙盒文件图文教程(真机+模拟器)
[iOS系列]-iOS查看沙盒文件图文教程(真机+模拟器) 1:模拟器 1.1 方法1: 程序中打印一下的地址,能直接前往沙盒路径. NSString *path = [NSSearchPathFor ...
- 大话设计模式C++实现-第14章-观察者模式
一.UML图 关键词:Subject维护一个Observer列表.Subject运行Notify()时就运行列表中的每一个Observer的Update(). 二.概念 观察者模式:定义了一种一对多的 ...
- Tomcat9无法启动
闲来无事,重新学习一下Java, 去Tomcat官网下载Tomcat,各种版本,7-8-9,果断下载最新的9,解压后,无需安装,到bin文件夹下启动, 结果总是一闪而过,百度: 1.查看8080是否占 ...
- 将项目上传到GitHub
第一步: 1.进入Github首页,点击New repository新建一个项目 2.填写相应信息后点击create即可 Repository name: 仓库名称 Description(可选): ...
- 创建oracle数据库job服务
创建oracle数据库job服务:PlSqlDev操作job https://www.baidu.com/link?url=5vXhw0IqjvWEAgGSIYsSEVPvJb6njGkJ-_P_VF ...
- 字符设备驱动另一种写法—mmap方法操作LED
最近在看韦老师的视频,讲解了很多种字符设备的驱动写法.经过自己的研究之后,我发现还有另外一种写法,直接在应用层操作,省去了内核中的地址映射部分,使得用户可以在应用层直接操作LED. mm ...
- Mysql数据库基础操作
Mysql数据库基础操作 在mysql数据库中开启使用tab键补全功能 1)修改主配置文件/etc/mysql/my.cnf(mysql和mariadb目录有些不同) vim /etc/mysql/m ...
- 搭建CARDBOARD+ANDROID+unity3d的VR开发环境
一.下载最新unity3d(u3d官网) 二.下载最新cardboardsdkforunity(https://github.com/googlesamples/cardboard-unity) 三. ...
- Spring IOC 一——容器装配Bean的简单使用
下文:SpringIOC 二-- 容器 和 Bean的深入理解 写在前面 这篇文章去年写的,缘起于去年某段时间被领导临时"抓壮丁"般的叫过去做java开发,然后在网上找了一个 Sp ...
- spoj 962 IM - Intergalactic Map【最大流】
因为是无向图,所以从1到2再到3等于从2到1和3.用拆点来限制流量(i,i+n,1),然后连接(s,2+n,1),(1,t,1),(3,t,1),对于原图中的边连接(x+n,y,1)(y+n,x,1) ...