【数据结果】
学校数、学院数:112,2657。
【数据来源】
中国教育在线(www.eol.cn)211院校研招学院。
http://www.eol.cn/html/ky/gxmd/211.shtml
import sys
import os
import requests
from time import sleep
from bs4 import BeautifulSoup
import pprint
from openpyxl import Workbook
import time curPath = os.path.abspath(os.path.dirname(__file__))
rootPath = os.path.split(curPath)[0]
sys.path.append(rootPath) res_dic, url, url_sub_l = {}, 'http://www.eol.cn/html/ky/gxmd/211.shtml', [] r = requests.get(url)
r.encoding = 'gb2312'
soup = BeautifulSoup(r.text, 'html.parser')
l = soup.find_all('a')
for i in l:
if i.text == '招生专业目录':
url_sub_l.append(i.attrs['href'])
res_dic = {}
for url in url_sub_l:
sleep(1)
r = requests.get(url)
r.encoding = 'gb2312'
soup = BeautifulSoup(r.text, 'html.parser')
u = soup.title.text.split('研究生招生专业目录')[0].replace(' ','')
if u in res_dic:
continue
res_dic[u] = []
l = soup.find('div', attrs={'class': 'content'}).find_all('h3')
for i in l:
res_dic[u].append(i.text.replace(' ', '')) wb = Workbook()
worksheet = wb.active
file_title_l = 'u,i'.replace(' ', '').split(',')
worksheet.append(file_title_l)
for i in res_dic:
for ii in res_dic[i]:
l = [i, ii]
worksheet.append(l)
localtime_ = time.strftime("%y%m%d%H%M%S", time.localtime())
file_name = '211院校-研招学院-中国教育在线(www.eol.cn)'
file_name = '%s%s' % (file_name, localtime_)
file_name_save = '%s\\%s%s' % (curPath, file_name, '.xlsx')
wb.save(file_name_save)

  

学校 学院数 备注
清华大学 39 数据来源 http://www.eol.cn/html/ky/gxmd/211.shtml
北京大学 37
中国人民大学 29
北京交通大学 13
北京工业大学 20
北京航空航天大学 25
北京理工大学 21
北京科技大学 19
北京化工大学 11
北京邮电大学 16
中国农业大学 16
中国传媒大学 25
中央民族大学 27
北京师范大学 37
对外经济贸易大学 14
北京中医药大学 11
北京外国语大学 23
中国地质大学(北京) 16
中国矿业大学(北京) 11
中国石油大学(北京) 14
中国政法大学 16
中央财经大学 23
华北电力大学 12
北京体育大学 1
南开大学 34
天津大学 23
天津医科大学 1
河北工业大学 16
郑州大学 6
大连理工大学 28
东北大学 16
辽宁大学 25
大连海事大学 28
吉林大学 51
东北师范大学 23
延边大学 20
哈尔滨工业大学 39
哈尔滨工程大学 16
东北农业大学 14
东北林业大学 18
太原理工大学 24
复旦大学 43
同济大学 32
上海交通大学 30
华东师范大学 39
上海外国语大学 20
上海大学 1
东华大学 13
上海财经大学 15
华东理工大学 20
解放军第二军医大学 15
南京大学 34
东南大学 31
河海大学 20
中国药科大学 8
南京理工大学 19
江南大学 17
南京航空航天大学 18
南京农业大学 19
苏州大学 29
南京师范大学 25
浙江大学 40
中国科学技术大学 19
安徽大学 31
合肥工业大学 20
厦门大学 70
福州大学 22
山东大学 43
中国海洋大学 29
中国石油大学 12
南昌大学 21
武汉大学 38
华中科技大学 42
中国地质大学 28
华中师范大学 35
华中农业大学 16
武汉理工大学 24
中南财经政法大学 17
湖南大学 25
中南大学 42
湖南师范大学 29
国防科学技术大学 10
中山大学 63
华南理工大学 28
华南师范大学 24
暨南大学 29
广西大学 28
云南大学 33
贵州大学 30
四川大学 46
电子科技大学 1
西南交通大学 22
四川农业大学 24
西南财经大学 30
重庆大学 33
西南大学 41
西安交通大学 23
西北工业大学 16
陕西师范大学 27
西北大学 25
西北农林科技大学 20
长安大学 17
西安电子科技大学 11
解放军第四军医大学 12
海南大学 21
宁夏大学 22
青海大学 10
内蒙古大学 20
兰州大学 29
新疆大学 22
石河子大学 20
西藏大学 11
合计 2657

学院名单-211院校研招学院-中国教育在线(www.eol.cn)170915164402的更多相关文章

  1. 结合jquery的前后端加密解密 适用于WebApi的SQL注入过滤器 Web.config中customErrors异常信息配置 ife2018 零基础学院 day 4 ife2018 零基础学院 day 3 ife 零基础学院 day 2 ife 零基础学院 day 1 - 我为什么想学前端

    在一个正常的项目中,登录注册的密码是密文传输到后台服务端的,也就是说,首先前端js对密码做处理,随后再传递到服务端,服务端解密再加密传出到数据库里面.Dotnet已经提供了RSA算法的加解密类库,我们 ...

  2. [No000030]程序员节发点别的:中国教育整个把人脑子搞坏了-易中天

    导读 在易中天看来,中国教育和中国文化的问题一样,是弱智化.搞坏的原因是什么?是我们的教育评价目标就是"成王败寇"四个字.他明确提出反对励志,反对培优,反对成功学,反对望子成龙.他 ...

  3. 用 Python 分析今年考研形势

    还有5天,就到了考研初试的时间了. ! 尽管今年研招网内部,已经做了优化改善,还是抵挡不住考生们的报名热情(网站崩溃). ​ 2017年考研人数增长至201万人, 2018年则达到238万人, 201 ...

  4. V3学院XILINX FPGA寒假班培训感受 江苏大学 电子信息科学与技术 邓普建

    事先申明一点,我是大一的学生,因此会站在一个新生的角度叙述. 刚开始接触V3学院是在江苏大学与V3学院合办的FPGA/SOC培训中,那是对全校开放的免费培训,历时三个周末.我那时有幸从头听到了尾,觉得 ...

  5. 计算机保研,maybe this is all you need(普通双非学子上岸浙大工程师数据科学项目)

    写在前面 9.28接收了拟录取通知,也终究是尘埃落定了,我人生的又一个阶段也终于结束.面对最终录取结果,或多或少会有所遗憾,但也还是基本达到了预期的目标了. 作为在今年严峻的保研形势下幸存的我,一直想 ...

  6. 院校-国外-美国:斯坦福大学( Stanford)

    ylbtech-院校-国外-美国:斯坦福大学( Stanford) 斯坦福大学(Stanford University),全名小利兰·斯坦福大学(Leland Stanford Junior Univ ...

  7. 2014中国黑客榜(beta版)

    黑客,英文hacker.精通计算机各类技术的计算机高手,泛指擅长IT技术的人群.计算机科学家. 最近受某机构所托搜集国内活跃黑客近况.本着客观专业,权威可信的原则参考了国内从00年到最新的黑客榜单,以 ...

  8. 数据分析:中国高校更名历史 Python

    上周领了新任务,做国内高校改名历史的统计,这个挺有意思,以下是我任务完成过程,和大家分享. 一. 数据收集 数据需求:目前已有高校校名,各高校改名历史记录 高校校名数据来源:尝试从高校排名网站(iPI ...

  9. 院校-德国:亚琛工业大学(RWTH)

    ylbtech-院校-德国:亚琛工业大学(RWTH) 1.返回顶部 1. 亚琛工业大学(RWTH)成立于1870年,是德国著名理工类大学之一,也是世界顶尖理工类大学之一 ,长久以来被誉为“欧洲的麻省理 ...

随机推荐

  1. Elasticsearch 基础使用

    使用 cURL 执行 REST 命令 可以对 Elasticsearch 发出 cURL 请求,这样很容易从命令行 shell 体验该框架. “Elasticsearch 是无模式的.它可以接受您提供 ...

  2. Powershell 远程管理

    一直使用 mstsc,为了防止墨菲定律,准备一些备用方案 环境,win10 to win12 winrm是windows 一种方便远程管理的服务: 首先要开启winrm service,便于在日常工作 ...

  3. vue vue-router beforeRouteEnter

    beforeRouteEnter (to, from, next) { // 在渲染该组件的对应路由被 confirm 前调用 // 不!能!获取组件实例 `this` // 因为当守卫执行前,组件实 ...

  4. mongo 增

    mongodb存储的是文档,文档是json格式的对象,我们的增删改查,都要传输json对象 json是一个对象,js里有数组这个概念,只需要把多个对象放到一个数组里,即可 use test //首先选 ...

  5. discuz密码生成

    Discuz的密码加密算法其实就是两次MD5加密,首先用明文进行一次加密,之后随机生成一个salt,再把第一次的密文后面添加salt作为明文再进行一次MD5加密.salt保存在uc_members表里 ...

  6. 利用NIO的Selector处理服务器-客户端模型

    package NIOTEST; import java.io.IOException; import java.net.InetAddress; import java.net.InetSocket ...

  7. Word 操作

    1.出文件,最后一页是附件.最后一页的页码不想要.如何删除?用的是 office word 2010版本,跟07 03版本界面不一样. 在最后一页的最前面插入分节符:下一页 ,编辑页脚.让页脚“取消链 ...

  8. Java并发编程(一)学习大纲

    (一)学习大纲 (二)线程与并发编程的概念 (三)线程安全.原子操作.复合操作.竞态条件.加锁机制(内置锁.重入) (四)对象的共享:可见性.失效数据.非原子的64位操作,加锁与可见性,volatil ...

  9. Linux中终端和控制台区别

    Linux中终端和控制台区别: 终端:英文名叫terminal 控制台:英文名叫console 两者区别要从以前的多人使用的计算机开始 以前,由于计算机很昂贵,所用一台计算机一般由多个人同时使用.这样 ...

  10. Unity3D引擎之渲染技术系列一

    笔者介绍:姜雪伟,IT公司技术合伙人,IT高级讲师,CSDN社区专家,特邀编辑,畅销书作者.国家专利发明人;已出版书籍:<手把手教你架构3D游戏引擎>电子工业出版社和<Unity3D ...