Python 爬取 42 年高考数据，告诉你高考为什么这么难？

作者 | 徐麟

历年录取率

可能很多经历过高考的人都不知道高考的全称，高考实际上是普通高等学校招生全国统一考试的简称。从1977年国家恢复高考制度至今，高考经历了许多的改革，其中最为显著的变化就是录取率的显著提升，曾经的“千军万马过独木桥”的场景得到了一定程度的缓解。

我们首先看下1977-2018年历年的录取人数和未录取（落榜）人数变化情况，本文数据均来自于网络公开高考数据：

可以看到1977年恢复高考之后的几年，由于种种原因，高考人数到达了一个比较高的点，随后有所下降。到2000年之后，高考的人数有了进一步的提升，录取人数也随之大幅提升，2008、2009达到了顶峰（此时心疼自己1秒），2010年之后参与高考的人数趋于平稳。

通过上图也可以发现，早期的高考难度之高，未录取人数是录取人数的数倍之多，而且早期的高考实际上在开始之前有预选的过程，能够参加高考的考生实际上已经经过了一轮大浪淘沙的过程。随着教育改革，越来越多的考生有机会通过高考接受更进一步的教育。

我们通过下面的百分比图，对于录取率的变化进一步加深认知：

部分代码如下：

setwd('D:/爬虫/高考')

data = read_excel('历年录取率.xlsx')

data_year = melt(data,id.vars = '年份',measure.vars = c('录取','未录取'),

variable.name='录取情况', value.name='人数(万)')

ggplot(data_year,aes(x=年份,y=`人数(万)`,fill=录取情况))+

      geom_area(position = 'stack')+

      ggtitle('历年高考人数统计(1977-2018)')+ theme_wsj()+

      theme(axis.text.x = element_text(size=15),

            axis.text.y = element_text(size=15),

            axis.title =element_text(size=15),

            plot.title = element_text(hjust=0.5,size=25,face='bold'),

            panel.grid = element_blank(),

            legend.position = 'top',

            legend.title = element_blank(),

            legend.text = element_text(size=15),

            panel.background = element_blank(),

            axis.line = element_blank(),

            axis.ticks = element_blank()

            )+xlim(1977,2018)

　　说到这，似乎大家会认为现在的高考并不困难，录取率已经到达了8成左右，通过高考已经成了家常便饭，如果你真的这样认为，那只能将下面的表情包送你：

三座“大山”

名校录取率

前面我们提到的录取率有了显著的提升，然而录取率实际上是包括了所有的录取情况，同时包含了本科以及专科的录取情况。真正的“211”，“985”名校的竞争实际上还是异常激烈的，特别是在一些处于“地狱模式”的高考省份（由于没有在网上找到海南省的相关数据，我们选取了其他三十个省份、直辖市的数据）：

下面就为大家对比各个省份2018年的985、211录取率：

可以看到，不同省份的985和211录取率有着比较明显的差距，12个省份的985录取率低于1.5%，安徽，河南，江苏和贵州更是低于1.2%，作为山东考生的作者也不由得表示“自愧不如”。

即使是录取率最高的省份，985和211的录取率也只是5.8%和13.9%，结合现在各大企业在招人要求中对985和211的要求，高考真的并没有真的变得简单。

高考人数

除了名校录取率低之外，高考人数之多也是横亘在考生面前需要跨过的一个挑战。由于参与高考人数非常多，对于考试精细度就有了非常高的要求，可能一个细节的失误就会在全省的排名中下降非常多。

同样，我们看下各省2018年参与高考的人数：

河南省2018年的高考人数达到了86.5万，86.5万这个数据也超过了世界上接近2/3的国家人口数量。广东、山东、四川三个省的高考人数也超过了50万。由于参与高考的人数众多，这些省的高考几乎都是“肉搏战”。

高考题目难

除了名校录取率低，竞争人数多，另一个让广大考生为之“折服”的就是那些难度大到放飞自我的题目。其中一个省份的题目难度几乎是所有考生公认的最高，那就是江苏省，包括小编所在山东省在内的很多其他省的老师，都会告诉学生不需要关注江苏的历年题目，因为本省的考试题目不会那么难。

除了题目难度大，江苏高考改革的力度和速度也是冠绝全国，我们整理了一份江苏省2000年以来的历年高考改革的路线图：

看到这些模式的名称，可能大家已经有些眩晕，也深切体会到能从江苏高考中杀出重围的都是勇士。既然已经眩晕，不如就眩晕到底，下面是一道江苏省高考的真题，自行体验难度：

数学、物理这种大杀器都无需出场，只需一道作文题在作者这种“语文天残”看来就已经slay全场。

前面我们说了那么多高考的困难之处，是不是考生们真的就手足无措了呢，实际上并不是，只需要手握一些高考专属“杀器”就可以迎刃而解（以上纯属虚构）

高考“杀器”

五年高考三年模拟

此杀器的使用方法无需赘述，只需把其全部吃透，虽然这也不表示高考就一定会有好成绩。希望各位考生努力复习，切勿如同书名一样“五年高考，三年模拟”。

写在最后：

虽然我们前面列举了高考那么多的不易，但高考实际上为广大考生提供了改变自己人未来人生命运的机会。相较于其他很多缥缈不定的发展道路，高考给了大家一个明确的努力方向。

最后祝愿广大考生都能够放平心态（虽然并不现实），在高考中发挥自己所学，不留遗憾。取得不错的结果也不要因此沾沾自喜，没有达到自己的预期的也不要因此消沉，高考是我们人生中非常重要的一段历程，但不能完全决定我们未来的人生，未来还有很多需要去奋斗、去努力的地方。

给大家推荐一个软件测试学习的视频教程：软件测试开发自学基础【测试自动化在线教程】

Python 爬取 42 年高考数据，告诉你高考为什么这么难？的更多相关文章

利用python爬取58同城简历数据
利用python爬取58同城简历数据利用python爬取58同城简历数据最近接到一个工作,需要获取58同城上面的简历信息(http://gz.58.com/qzyewu/).最开始想到是用pyth ...
手把手教你使用Python爬取西刺代理数据（下篇）
/1 前言/ 前几天小编发布了手把手教你使用Python爬取西次代理数据(上篇),木有赶上车的小伙伴,可以戳进去看看.今天小编带大家进行网页结构的分析以及网页数据的提取,具体步骤如下. /2 首页分析 ...
python爬取豆瓣电影信息数据
题外话+ 大家好啊,最近自己在做一个属于自己的博客网站(准备辞职回家养老了,明年再战)在家里琐事也很多, 加上自己一回到家就懒了(主要是家里冷啊! 广东十几度,老家几度,躲在被窝瑟瑟发抖,) 由于 ...
python 爬取猫眼电影top100数据
最近有爬虫相关的需求,所以上B站找了个视频(链接在文末)看了一下,做了一个小程序出来,大体上没有修改,只是在最后的存储上,由txt换成了excel. 简要需求:爬虫爬取猫眼电影TOP100榜单数据 ...
一篇文章教会你用Python爬取淘宝评论数据（写在记事本）
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. 很多人学习python,不知道从何学起.很多人学习python,掌握了 ...
Python爬取网站上面的数据很简单，但是如何爬取APP上面的数据呢
python爬取中国天气网站数据并对其进行数据可视化
网址:http://www.weather.com.cn/textFC/hb.shtml 解析:BeautifulSoup4 爬取所有城市的最低天气对爬取的数据进行可视化处理按温度对城市进行排 ...
Python爬取猫眼top100排行榜数据【含多线程】
# -*- coding: utf-8 -*- import requests from multiprocessing import Pool from requests.exceptions im ...
python爬取新浪股票数据—绘图【原创分享】
目标:不做蜡烛图,只用折线图绘图,绘出四条线之间的关系. 注:未使用接口,仅爬虫学习,不做任何违法操作. """ 新浪财经,爬取历史股票数据 ""&q ...

随机推荐

JVM面试题总结
1.介绍下 Java 内存区域(运行时数据区) Java 虚拟机在执行 Java 程序的过程中会把它管理的内存划分成若干个不同的数据区域. JDK 1.8之前主要分为:堆.方法区.虚拟机栈.本地方法栈 ...
Win10下创建virtualenv Linux下创建
虚拟环境为什么要搭建虚拟环境开发多个不同的项目可能需要用到同一个包不同版本新版本会覆盖旧的作用虚拟环境可以搭建独立的Python运行环境使项目之间版本不受影响 Linux下如何搭建虚拟环 ...
skywalking与pinpoint全链路追踪方案对比
由于公司目前有200多微服务,微服务之间的调用关系错综复杂,调用关系人工维护基本不可能实现,需要调研一套全链路追踪方案,初步调研之后选取了skywalking和pinpoint进行对比; 选取skyw ...
disruptor架构四多生产者多消费者执行
1.首先介绍下那个时候使用RingBuffer,那个时候使用disruptor ringBuffer比较适合场景比较简单的业务,disruptor比较适合场景较为复杂的业务,很多复杂的结果必须使用di ...
Java Agent（上）
1.java agent是什么? --->对用户透明,不侵入用户业务代码.让java虚拟机加载agent jar 2.java agent有什么用? --->应用场景例如:调用链追踪项目, ...
java命令行输入参数
Java命令行输入参数代码用例:命令行输入参数,并进行加法运算. public class Demo01 { public static void main(String[] args) { for ...
max depth exceeded when dereferencing c0-param0问题的解决
在做项目的时候,用到了dwr,有一次居然报错,错误是 max depth exceeded when dereferencing c0-param0 上网查了一下,我居然传参数的时候传的是object ...
如何使用PL/SQL工具批量导出表、存储过程、序列
PLSQL作为Oracle数据库进行操作常用工具,可以很方便的对表以及数据进行处理.工作中如果遇到数据库转移,需要将老数据库中的建表.建序列和存储过程语句导出,然后导入到新的数据库中这样序列号会自动, ...
堆/题解 P3378 【【模板】堆】
概念: 堆就是一颗二叉树,满足父亲节点总是比儿子节点大(小).因此,堆也分为大根堆和小根堆,大根堆就是父亲节点比儿子节点大,小根堆正好相反.注意加粗的地方,是每一个节点哦!!!!! 还是直接看例题吧, ...
iWS工作流加载顺序
1.初次加载-LoadDataFields(IsPostBack=false); 2.保存-LoadDataFields(IsPostBack=true)-ValidateDataFields-Sav ...

Python 爬取 42 年高考数据，告诉你高考为什么这么难？

Python 爬取 42 年高考数据，告诉你高考为什么这么难？的更多相关文章

随机推荐

热门专题