python-最好大学排名

# -*- coding: utf-8 -*-
"""
Created on Mon Apr 3 09:37:52 2017

@author: zuihaodaxuepaiming
"""
import bs4
import requests
from bs4 import BeautifulSoup

def getHtmlText(url):
try:
r = requests.get(url, timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ''

def fillUnivText(html,uinfo):
soup = BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr, bs4.element.Tag):
tds = tr('td')
uinfo.append([tds[0].string, tds[1].string, tds[3].string])#append只能追加一项，可以将多项作为列表追加，即添加【】符号

def printUnivText(uinfo,num):
# tplt = "{}\t{}\t{2:^10}"
print("{:^3}\t{:^3}\t{:^3}".format("排名排名","名称","总分"))
for i in range(num):
u = uinfo[i]
print("{:^5}\t{:^10}\t{:^10}".format(u[0],u[1],u[2]))

def main():
uinfo = []
url = ("http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html")
r = getHtmlText(url)
fillUnivText(r,uinfo)
printUnivText(uinfo,20)

main()

--------------------

10:56:07
'{0:{3}}' 或者 {:^3}
10:56:30
{0:3}也可以
10:56:56
为什么要从0开始？
10:57:28
就是不能{1：^3} , python文档里面没有这种切片格式
10:59:03
{0：3}意思是接着前面的切取第0、1、2个共3*2个位值是吗？
@大大的
10:59:12
^符号就是从头开始，你又制定切片从1开始不矛盾吗？
10:59:14
类似于列表或字符串的切片，只是切空格符切成你想要的长度再通过format填进去（我是这么理解的，不知道对不对。）
切片、中英文对齐问题

待解决==占坑

python-最好大学排名的更多相关文章

Python 中国大学排名定向爬虫
代码来自于中国大学Mooc北京理工大学Pythont教学团队:https://www.icourse163.org/learn/BIT-1001870001#/learn/content?type=d ...
python爬虫学习(二)：定向爬虫例子-->使用BeautifulSoup爬取"软科中国最好大学排名-生源质量排名2018"，并把结果写进txt文件
在正式爬取之前,先做一个试验,看一下爬取的数据对象的类型是如何转换为列表的: 写一个html文档: x.html<html><head><title>This is ...
Python爬虫实战：2017中国最好大学排名
抓取内容: 从最好大学网上抓取中国前10的大学排名.大学名称.总分,并数据格式左对齐. http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html 首先 ...
Python之爬虫-中国大学排名
Python之爬虫-中国大学排名 #!/usr/bin/env python # coding: utf-8 import bs4 import requests from bs4 import Be ...
python爬虫学习心得：中国大学排名(附代码)
今天下午花时间学习了python爬虫的中国大学排名实例,颇有心得,于是在博客园与各位分享首先直接搬代码: import requests from bs4 import BeautifulSoup ...
python网络爬虫-中国大学排名定向爬虫
爬虫定向爬取中国大学排名信息 #!/usr/bin/python3 import requests from bs4 import BeautifulSoup import bs4 #从网络上获取大学 ...
python爬虫入门---第二篇：获取2019年中国大学排名
我们需要爬取的网站:最好大学网我们需要爬取的内容即为该网页中的表格部分: 该部分的html关键代码为: 其中整个表的标签为<tbody>标签,每行的标签为<tr>标签,每行中 ...
python_大学排名爬取
逻辑思路是什么? 1. 获取页面 2. 处理页面,提取信息 3. 格式输出先走面向过程编程: 1. 要定义3个函数,对应以上三个过程 2. 在__main__函数中传入参数,并执行以上三个过程 #! ...
美国大学排名之本科中最用功的学校top15
美国大学排名之本科中最用功的学校top15 威久留学2016-07-29 13:15:59美国留学留学新闻留学选校阅读(490)评论(1) 去美国留学的同学可能都知道USnews美国大学排名, ...
2014年QS世界大学排名
新浪教育[微博]讯近日2014QS世界大学排行榜发布,榜单前十强均为英美名校.其中麻省理工大学以绝对优势位居榜首:英国剑桥大学及帝国理工学院并列排名第二:哈佛大学较去年而言名次略微下降,跌至第四. ...

随机推荐

vue-progressbar 知识点
使用步骤: 安装 import.Vue.use() 组件里,created() 和 mounted() 复制官方github地址上的代码官方github地址:https://github.com/h ...
hanlp中文自然语言处理的几种分词方法
自然语言处理在大数据以及近年来大火的人工智能方面都有着非同寻常的意义.那么,什么是自然语言处理呢?在没有接触到大数据这方面的时候,也只是以前在学习计算机方面知识时听说过自然语言处理.书本上对于自然语言 ...
gitlab配合walle搭建发布系统
理解walle实现发布代码的原理: 宿主机:walle系统搭建的服务器以及拉取gitlab代码的服务器,这个时候gitlab一般都是另外一台服务器. 目标机器:版本最终发布的目的机器,或者目的机群 ...
禁止HTML页面缓存
head标签里增加: <meta http-equiv="X-UA-Compatible" content="IE=8"> <meta htt ...
织梦ask标签的调用
EDE 问答首页调用标签标签名称: ask 功能说明:问答调用标签适用范围:全局使用基本语法: {dede:ask row='6' qtype='new' tid='0' titlelen='2 ...
[转]C#调用Excel VBA宏
[转载自]http://www.shangxueba.com/jingyan/95031.html 附上一段原创常用代码计算列标题字符串 Function CalcColumn(ByVal c As ...
Android手机卸载第三方应用
测试机互相拆借,过多的应用占用手机空间,使用脚本将不需要的第三方应用卸载. #!/bin/sh #白名单 whiteName=( com.tencent.mobileqq com.tencent.mm ...
Linux性能分析 vmstat基本语法
vmstat vmstat 统计虚拟内存信息,可以对操作系统的proc.memory.CPU.IO等信息进行统计以呈现给用户. 根据操作系统的不同,vmstat的输出结果会有不同.大家可 ...
javascript的节点的概念
<html> <head> <title></title> </head> <body> </body> </ ...
ExtJS模板与菜单的使用案例-床位卡
ExtJS的模板的使用: 项目中场景基本就是表格模型: TPL:自己编写模板 store:数据源 UI组件: tbar,rbr,bbar实现工具栏 PageBar与StatusBar:可以针对TPL的 ...

python-最好大学排名

python-最好大学排名的更多相关文章

随机推荐

热门专题