#使用parser获取图片信息,输出Python官网发布的会议时间、名称和地点。
# !/usr/bin/env/Python3
# - * - coding: utf-8 - * -
from html.parser import HTMLParser
import urllib.request
#使用parser获取图片信息,输出Python官网发布的会议时间、名称和地点。
class MyHTMLParser(HTMLParser):
def __init__(self):
super().__init__()
self.li = False
self.h3 = False
self.a = False
self.p = False
self.time = False
self.span1 = False
self.span2 = False
self.event_dict = {}
self.count = 0
def handle_starttag(self, tag, attrs):
if tag == 'li':
self.li = True
elif tag == 'h3':
for k, v in attrs:
if k == 'class' and v == 'event-title':
self.h3 = True
elif tag == 'a':
self.a = True
elif tag == 'p':
self.p = True
elif tag == 'time':
self.time = True
elif tag == 'span':
for k, v in attrs:
if k == 'class' and v == 'say-no-more':
self.span1 = True
elif k == 'class' and v == 'event-location':
self.span2 = True
def handle_data(self, data):
if self.li:
if self.h3 == True and self.a == True:
self.count += 1 # 用self.count作为self.IDdict的key,表示会议的次数
self.event_dict[self.count] = {}
self.event_dict[self.count]['name'] = data
elif self.p:
if self.time:
if not self.span1:
self.event_dict[self.count]['time'] = data
else:
self.event_dict[self.count]['time'] += (',' + data)
else:
if self.span2:
self.event_dict[self.count]['site'] = data
def handle_endtag(self, tag):
if tag == 'a':
self.a = False
elif tag == 'h3':
self.h3 = False
elif tag == 'span':
self.span1 = False
self.span2 = False
elif tag == 'time':
self.time = False
elif tag == 'p':
self.p = False
elif tag == 'li':
self.li = False
parser = MyHTMLParser()
def parse_python_event(html_data):
global parser
parser = MyHTMLParser()
parser.feed(html_data)
return parser.event_dict
def Hocontent(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
if __name__ == '__main__':
html_data = Hocontent('https://www.python.org/events/python-events/').decode(encoding="utf-8")
event = parse_python_event(html_data)
print('Conference: %s' % event)
for i in range(1, parser.count + 1):
print(event[i]['name'], '\n', event[i]['time'], '\t', event[i]['site'])
#使用parser获取图片信息,输出Python官网发布的会议时间、名称和地点。的更多相关文章
- python学习(解析python官网会议安排)
在学习python的过程中,做练习,解析https://www.python.org/events/python-events/ HTML文件,输出Python官网发布的会议时间.名称和地点. 对ht ...
- Python+Selenium学习笔记5 - python官网的tutorial - 交互模式下的操作
这篇笔记主要是从Python官网的Tutorial上截取下来,再加上个人理解 1. 在交互模式下,下划线'_'还可以表示上一步的计算结果 2.引号转义问题. 从下图总结的规律是,字符串里的引号如果和引 ...
- 今天去python官网下载包安装的时候的问题记录
去官网下载了 tar压缩包 放到了site-packages下解压 然后使用 python setup.py install 安装 安装完后,所要引用的模块文件居然还在解压出来的压缩文件里面,导致无法 ...
- python官网导航翻译
- 微服务实战系列--Nginx官网发布(转)
这是Nginx官网写的一个系列,共七篇文章,如下 Introduction to Microservices (this article) Building Microservices: Using ...
- python官网几个下载文件的区别
进入python官方,下载python编译器,提供了如下几个版本进行选择,这些版本分别是什么意思呢? Python 3.7.1 - 2018-10-20 Download Windows x86 we ...
- python官网
https://www.python.org/ https://docs.python.org/2/library/pydoc.html
- 获取Xshell Xftp等官网下载地址
1. 首先还是得填写邮箱获取试用链接地址,例如我这次获取的是: https://cdn.netsarang.net/c5711331/Xshell-6.0.0175.exe 关键需要记下 c57113 ...
- Python+Selenium学习笔记14 - python官网的tutorial - just() fill() format()
repr(x).rjust(n) 左侧空格填充,右侧列对齐,str()和repr()是一种输出,也可不用,直接x.rjust() repr(x).ljust(n) 右侧空格填充,左侧列对齐 rep ...
随机推荐
- git 远程仓库管理
要参与任何一个 Git 项目的协作,必须要了解该如何管理远程仓库.远程仓库是指托管在网络上的项目仓库,可能会有好多个,其中有些你只能读,另外有些可以写.同他人协作开发某 个项目时,需要管理这些远程仓库 ...
- 利用shell批量改名和linux中取随机数的方法
先批量创建文件 #!/bin/sh if [ ! -d /tmp/chenyao ] then mkdir /tmp/chenyao -p fi cd /tmp/chenyao ..} do touc ...
- tortoiseGit保存用户名和密码
简介:tortoiseGit(乌龟git)图形化了git,我们用起来很方便,但是我们拉取私有项目的时候,每次都要输入用户名和密码很麻烦,这里向大家介绍怎么避免多少输入 试验环境:window10,安装 ...
- css简单实现火焰效果
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...
- Object-C知识点
Object-C常用的知识点,以下为我在实际开发中用到的知识点,但是又想不起来,需要百度一下的知识点 1. p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: ...
- 老李推荐:第6章4节《MonkeyRunner源码剖析》Monkey原理分析-事件源-事件源概览-翻译命令字串
老李推荐:第6章4节<MonkeyRunner源码剖析>Monkey原理分析-事件源-事件源概览-翻译命令字串 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自 ...
- [Linux] PHP程序员玩转Linux系列-nginx初学者引导
1.PHP程序员玩转Linux系列-怎么安装使用CentOS 2.PHP程序员玩转Linux系列-lnmp环境的搭建 3.PHP程序员玩转Linux系列-搭建FTP代码开发环境 4.PHP程序员玩转L ...
- android开发之-Android 开发之4.0界面设计原则-整理
设计原则: 一.让人着迷: 1.给人惊喜:使用漂亮的界面.精心的动画.适时的音乐. 2.真实的对象比按钮和菜单更有趣 这句话的意思是:使用描述描述性的图标作为快捷方式,界面美观 当然这个快捷方 ...
- How To Use ggplot in ggplot2?
1.What is ggplot2 ggplot2基本要素 数据(Data)和映射(Mapping) 几何对象(Geometric) 标尺(Scale) 统计变换(Statistics) 坐标系统(C ...
- js alert(“”)弹框 自定义样式
首先用css渲染一个样式 #msg{ height: 2rem; text-align: center; position: fixed; top: 50%; margin-top: -1rem; l ...