2020中国最好大学排名.py（亲测有效）

import requests

from bs4 import BeautifulSoup

import bs4

def getHTMLText(url):

    try:

        r = requests.get(url,timeout=30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return ""

def fillUnivList(ulist,html):

    soup = BeautifulSoup(html,"html.parser")

    for tr in soup.find('tbody').children:

        if isinstance(tr,bs4.element.Tag):

            tds = tr('td')

            ulist.append([tds[0].text.strip(),tds[1].text.strip(),tds[4].text.strip()])  # strip函数移除空格或换行符

def printUnivList(ulist,num):

    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"  # {3}表示使用format的第三个变量，即chr(12288)中文字符填充

    print("{:^9}\t{:^15}\t{:^8}".format("排名","学校名称","分数"))

    for i in range(num):

        u = ulist[i]

        print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main():

    uinfo = []

    url = "https://www.shanghairanking.cn/rankings/bcur/2020"

    html = getHTMLText(url)

    fillUnivList(uinfo,html)

    printUnivList(uinfo,20)  # 前20所

main()

2020中国最好大学排名.py（亲测有效）的更多相关文章

Python爬虫实战：2017中国最好大学排名
抓取内容: 从最好大学网上抓取中国前10的大学排名.大学名称.总分,并数据格式左对齐. http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html 首先 ...
python爬虫抓取中国最好大学排名1 清华大学北京 94.0 100.0 97.70% 清华大学 2 北京大学
import requests from bs4 import BeautifulSoup import bs4.element r=requests.get("http://www.zui ...
python爬虫学习(二)：定向爬虫例子-->使用BeautifulSoup爬取"软科中国最好大学排名-生源质量排名2018"，并把结果写进txt文件
在正式爬取之前,先做一个试验,看一下爬取的数据对象的类型是如何转换为列表的: 写一个html文档: x.html<html><head><title>This is ...
Intellij IDEA 2020.1.1 破解永久有效亲测100%成功
申明:本教程 WebStorm 破解补丁.激活码均收集于网络,请勿商用,仅供个人学习使用,如有侵权,请联系作者删除. 前言作为一个有强迫症的码农,怎么能忍受自己的开发工具跟不上潮流呢?笔者以前一直用 ...
python爬虫入门---第二篇：获取2019年中国大学排名
我们需要爬取的网站:最好大学网我们需要爬取的内容即为该网页中的表格部分: 该部分的html关键代码为: 其中整个表的标签为<tbody>标签,每行的标签为<tr>标签,每行中 ...
Python之爬虫-中国大学排名
Python之爬虫-中国大学排名 #!/usr/bin/env python # coding: utf-8 import bs4 import requests from bs4 import Be ...
python网络爬虫-中国大学排名定向爬虫
爬虫定向爬取中国大学排名信息 #!/usr/bin/python3 import requests from bs4 import BeautifulSoup import bs4 #从网络上获取大学 ...
python爬虫学习心得：中国大学排名(附代码)
今天下午花时间学习了python爬虫的中国大学排名实例,颇有心得,于是在博客园与各位分享首先直接搬代码: import requests from bs4 import BeautifulSoup ...
python爬取中国大学排名
教程来自:[Python网络爬虫与信息提取].MOOC. 北京理工大学目标:爬取最好大学网前50名大学代码如下: import requests from bs4 import Beautiful ...
Pycharm 2020.01亲测激活到2089年
Pycharm 2020.01亲测激活到2089年,注意是2020.01版本. 下载jetbrains-agent.jar 链接: https://pan.baidu.com/s/1w1i15pT38 ...

随机推荐

php相关知识总结
class Father{ public static function getStatic(){ return new static(); } public static function getS ...
react和vue的区别及优缺点
区别: vue是双向绑定的,采用template: react是单向的,采用jsx. Vue的优缺点: 简单.快速.强大.对模块友好,但不支持IE8. React的优缺点: 速度快.跨浏览器兼容.模块 ...
WKWebView与JS的交互
转载:https://www.jianshu.com/p/253e76a74b38 用普通的UIWebView和JS交互大概核心代码是这样的 - (void)setupWebView{ self.w ...
vcsa7 页面出现“no healthy upstream”处理过程
一.昨天服务器出现"no healthy upstream"错误无法登录,搜索网络给出一下的思路: 对于"no healthy upstream"的错误提示,可 ...
nuxt,js中关于服务端不能使用localStorage和cookie的解决方案
参考链接:https://www.npmjs.com/package/cookie-universal-nuxt 1.安装下载 npm i --save cookie-universal-nuxt 2 ...
python代码抛出异常
from traceback import format_exc except Exception: print(format_exc())
Bug的前后台分类及定位技巧
必备工具:Firefox debug工具一般浏览器F12即可如何区分页面的bug问题归属:前端or后端前端bug主要分为3个类别:HTML,CSS,Javascript三类问题给个最大的区 ...
PLC入门笔记7
梯形图与指令表的转换后缀表达式开头是MPS 结尾是MPP 中间就是MRD啦!!!! MPS 存入堆栈(将目前累加器的内容存入堆栈.(堆栈指针加一))将当前数据栈顶数据复制一份到辅助栈栈深度+1 ...
mmdetection RPNHead--_init_()函数
RPNHead类包含的函数: (1)_init_():初始化函数 (2)_init_layers():设置Head中的卷积层 (3)forward_single():单尺度特征图的前向传播 (4)lo ...
【内存管理】ION内存管理器浅析（system heap）（基于linux 4.14）
什么是ION ION具体不知道是什么的缩写,只知道是android系统上google引入的内存管理方式,为了实现用户与内核间数据共享时零拷贝.多用于多媒体,比如camera和display,graph ...

2020中国最好大学排名.py（亲测有效）

2020中国最好大学排名.py（亲测有效）的更多相关文章

随机推荐

热门专题