2020中国最好大学排名.py（亲测有效）

import requests

from bs4 import BeautifulSoup

import bs4

def getHTMLText(url):

    try:

        r = requests.get(url,timeout=30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return ""

def fillUnivList(ulist,html):

    soup = BeautifulSoup(html,"html.parser")

    for tr in soup.find('tbody').children:

        if isinstance(tr,bs4.element.Tag):

            tds = tr('td')

            ulist.append([tds[0].text.strip(),tds[1].text.strip(),tds[4].text.strip()])  # strip函数移除空格或换行符

def printUnivList(ulist,num):

    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"  # {3}表示使用format的第三个变量，即chr(12288)中文字符填充

    print("{:^9}\t{:^15}\t{:^8}".format("排名","学校名称","分数"))

    for i in range(num):

        u = ulist[i]

        print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main():

    uinfo = []

    url = "https://www.shanghairanking.cn/rankings/bcur/2020"

    html = getHTMLText(url)

    fillUnivList(uinfo,html)

    printUnivList(uinfo,20)  # 前20所

main()

2020中国最好大学排名.py（亲测有效）的更多相关文章

Python爬虫实战：2017中国最好大学排名
抓取内容: 从最好大学网上抓取中国前10的大学排名.大学名称.总分,并数据格式左对齐. http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html 首先 ...
python爬虫抓取中国最好大学排名1 清华大学北京 94.0 100.0 97.70% 清华大学 2 北京大学
import requests from bs4 import BeautifulSoup import bs4.element r=requests.get("http://www.zui ...
python爬虫学习(二)：定向爬虫例子-->使用BeautifulSoup爬取"软科中国最好大学排名-生源质量排名2018"，并把结果写进txt文件
在正式爬取之前,先做一个试验,看一下爬取的数据对象的类型是如何转换为列表的: 写一个html文档: x.html<html><head><title>This is ...
Intellij IDEA 2020.1.1 破解永久有效亲测100%成功
申明:本教程 WebStorm 破解补丁.激活码均收集于网络,请勿商用,仅供个人学习使用,如有侵权,请联系作者删除. 前言作为一个有强迫症的码农,怎么能忍受自己的开发工具跟不上潮流呢?笔者以前一直用 ...
python爬虫入门---第二篇：获取2019年中国大学排名
我们需要爬取的网站:最好大学网我们需要爬取的内容即为该网页中的表格部分: 该部分的html关键代码为: 其中整个表的标签为<tbody>标签,每行的标签为<tr>标签,每行中 ...
Python之爬虫-中国大学排名
Python之爬虫-中国大学排名 #!/usr/bin/env python # coding: utf-8 import bs4 import requests from bs4 import Be ...
python网络爬虫-中国大学排名定向爬虫
爬虫定向爬取中国大学排名信息 #!/usr/bin/python3 import requests from bs4 import BeautifulSoup import bs4 #从网络上获取大学 ...
python爬虫学习心得：中国大学排名(附代码)
今天下午花时间学习了python爬虫的中国大学排名实例,颇有心得,于是在博客园与各位分享首先直接搬代码: import requests from bs4 import BeautifulSoup ...
python爬取中国大学排名
教程来自:[Python网络爬虫与信息提取].MOOC. 北京理工大学目标:爬取最好大学网前50名大学代码如下: import requests from bs4 import Beautiful ...
Pycharm 2020.01亲测激活到2089年
Pycharm 2020.01亲测激活到2089年,注意是2020.01版本. 下载jetbrains-agent.jar 链接: https://pan.baidu.com/s/1w1i15pT38 ...

随机推荐

开发Unity3D移动端输入插件 UGUI Touch Input Component
UGUI Touch Input Component 为了在移动设备上操控角色,本人便开发了UGUI Touch Input Component输入类插件. 特点本插件中总共包含三种组件:the v ...
python机器学习——PCA降维算法
背景与原理: PCA(主成分分析)是将一个数据的特征数量减少的同时尽可能保留最多信息的方法.所谓降维,就是在说对于一个$n$维数据集,其可以看做一个$n$维空间中的点集(或者向量集),而我们要把这个向 ...
luogu 4886
点分治好题统计距离正常点分治统计即可,我们只需考虑何时达到最优有两种情况: 第一:代价最大的询问两个端点在不同的两个子树中因为这种情况下,无论根向那个子树移动都会等价地增加到达另一个端点的代价, ...
python+scrcpy实现将安卓设备录屏并保存到pc本地
一)scrcpy下载及安装参考链接:https://zhuanlan.zhihu.com/p/80264357 二)python+scrcpy实现将安卓设备录屏并保存到pc本地示例代码: impo ...
中国人民公安大学 Chinese people’ public security university 网络对抗技术实验报告4
中国人民公安大学 Chinese people' public security university 网络对抗技术实验报告实验四恶意代码技术学生姓名陈禹年级 2018 区队 ...
Python turtle print TaiChi
import turtle turtle.pensize(20) turtle.pencolor("black") turtle.penup() turtle.goto(0,300 ...
本地mysql端口3306 一直干不掉这样解决
第一步:先whereis mysql(查找到MySQL的一些本地文件) 主要删除这两个再干掉端口3306 即可
C语言初级阶段7——指针3
C语言初级阶段7--指针3 指针数组:描述的是一个数组,存储的是指针 #include<stdio.h> void fun(int(*arr)[2]) { for (int i = 0; ...
当MYSQL报错时
输入mysqld --console查看错误针对error行进行排查
AD使用积累 - 板子上开孔的方法
有时候画板子时需要需要在板子上开一些槽孔,可以参考如下两种方法: 第一种方法:封闭曲线转换为槽孔. 1.在机械层画一个封闭图形或者画一根线: 2.选中这个图形或线,选择工具 - 转换 - 以选中的元素 ...

2020中国最好大学排名.py（亲测有效）

2020中国最好大学排名.py（亲测有效）的更多相关文章

随机推荐

热门专题