python 爬取糗事百科 gui小程序

前言：有时候无聊看一些搞笑的段子，糗事百科还是个不错的网站，所以就想用Python来玩一下。也比较简单，就写出来分享一下。嘿嘿

环境：Python 2.7 + win7

现在开始，打开糗事百科网站，先来分析。地址：https://www.qiushibaike.com

一般像这种都是文本的话，查看源代码就可以看到内容了。

已经可以看到都是在一个class 为content 的div里面，这样就很简单了，直接上正则表达式来匹配就好了。

<div.*?class="content">(.*?)</div>

这样等会再代码里面就可以提取出来段子内容了，再来看一下分页。

分页也很简单，很有规律，直接接上页数就行了。

OK 既然都分析完了那就直接上代码。

#-*- coding: UTF-8 -*-

# author : Corleone

from Tkinter import *

import urllib2,re

def load(page):

        url="http://www.qiushibaike.com/text/page/"+str(page)+"/?s=4937798"

        user_agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36"

        headers={'User-Agent':user_agent}

        res=urllib2.Request(url,headers = headers)

        html = urllib2.urlopen(res).read()

        reg=re.compile(r'<div.*?class="content">(.*?)</div>',re.S)

        duanzi=reg.findall(html)

        return duanzi

i=0

page=1

def get():

    if i==0:

        txtlist=load(page)

        page+=1

    if i<20:

        txt.delete(1.0,END)

        txt.insert(1.0,txtlist[i].replace("<span>","").replace("</span>","").replace("</br>","").replace("\n","").replace("<br/>",""))

        i+=1

        global i

        global page

        global txtlist

    else:

        i=0

def main():

    root=Tk()   # 定义一个窗口

    root.title("Corleone") # 定义窗口标题

    root.geometry('500x500')  # 定义窗口大小

    b=Button(root,text="next",width=25,bg="red",command=get)  # 定义一个按钮

    b.pack(side=BOTTOM)  # 按钮的布局 放在窗口最下面

    global txt

    txt=Text(root,font=(u"黑体",20)) # 定义一个编辑界面

    txt.pack(expand=YES,fill=BOTH)  # 编辑界面布局 随窗口大小而自动改变

    root.mainloop()   # 让窗口一直在屏幕上显示出来 

main()

这里用到了Python自带的图形化界面库 Tkinter 来做gui界面。一页大概20个段子 next 按钮下一个看完了就翻页。

嘿嘿，这样就能直接看了。OK 好了这篇文章也很简单，没啥技术含量，莫见怪，代码都是我之前写的，现在依然能用，就发出来了 : )

python 爬取糗事百科 gui小程序的更多相关文章

python爬取糗事百科段子
初步爬取糗事百科第一页段子(发布人,发布内容,好笑数和评论数) #-*-coding:utf--*- import urllib import urllib2 import re page = url ...
Python爬取糗事百科
import urllib import urllib.request from bs4 import BeautifulSoup """ 1.抓取糗事百科所有纯 ...
Python爬取糗事百科示例代码
参考链接:http://python.jobbole.com/81351/#comment-93968 主要参考自伯乐在线的内容,但是该链接博客下的源码部分的正则表达式部分应该是有问题,试了好几次,没 ...
8.Python爬虫实战一之爬取糗事百科段子
大家好,前面入门已经说了那么多基础知识了,下面我们做几个实战项目来挑战一下吧.那么这次为大家带来,Python爬取糗事百科的小段子的例子. 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把 ...
Python爬虫实战一之爬取糗事百科段子
大家好,前面入门已经说了那么多基础知识了,下面我们做几个实战项目来挑战一下吧.那么这次为大家带来,Python爬取糗事百科的小段子的例子. 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把 ...
转 Python爬虫实战一之爬取糗事百科段子
静觅 » Python爬虫实战一之爬取糗事百科段子首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来. 友情提示糗事百科在前一段时间进行了改版,导致 ...
python网络爬虫--简单爬取糗事百科
刚开始学习python爬虫,写了一个简单python程序爬取糗事百科. 具体步骤是这样的:首先查看糗事百科的url:http://www.qiushibaike.com/8hr/page/2/?s=4 ...
python爬虫之爬取糗事百科并将爬取内容保存至Excel中
本篇博文为使用python爬虫爬取糗事百科content并将爬取内容存入excel中保存·. 实验环境:Windows10 代码编辑工具:pycharm 使用selenium(自动化测试工具)+p ...
[爬虫]用python的requests模块爬取糗事百科段子
虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更 ...

随机推荐

IO （一）
1 IO(Input Output)流概述 IO流用来处理设备之间的数据传输. java对数据的操作是通过流的方式. java用于操作流的对象都在IO包中. 流按操作数据分为两种:字节流和字符流. 流 ...
端口扫描命令nmap
转:http://www.osyunwei.com/archives/2004.html 下面教大家在CentOS中用nmap查看主机端口: 一.安装nmap yum install nmap -y ...
msyql多软件连接
菜鸟一枚使用mysql删除数据库时,习惯性使用navicat,由于使用的是sqlyog备份的,就用sqlyog恢复数据库,结果总是报错. 用同事电脑没有问题,后来发现是用了不同的软件,导致数据库数据 ...
【转】AWK常用
awk是个优秀文本处理工具,可以说是一门程序设计语言.下面是awk内置变量. 一.内置变量表属性说明 $0 当前记录(作为单个变量) $1~$n 当前记录的第n个字段,字段间由FS分隔 FS 输入 ...
TCP那些事儿（下）
这篇文章是下篇,所以如果你对TCP不熟悉的话,还请你先看看上篇<TCP的那些事儿(上)> 上篇中,我们介绍了TCP的协议头.状态机.数据重传中的东西.但是TCP要解决一个很大的事,那就是要 ...
Spring 当 @PathVariable 遇上【. # /】等特殊字符
@PathVariable注解应该不是新鲜东西了Spring3.0就开始有了 URL中通过加占位符把参数传向后台举个栗子,如下比较要说的内容比较简单就大概齐的写一下画面侧 $.ajax({ typ ...
Tensorflow ActiveFunction激活函数解析
Active Function 激活函数原创文章,请勿转载哦~!! 觉得有用的话,欢迎一起讨论相互学习~Follow Me Tensorflow提供了多种激活函数,在CNN中,人们主要是用tf.nn ...
poj2479 最大子段和
题意:给定一个数列.求出数列中不相交的两个子段和,要求和最大解题思路:对每一个i来说,求出[0-i-1]的最大子段和以及[i-n-1]的最大子段和,再加起来,求出最大的一个.[0-i-1]的最大子段 ...
Cypher查询语言--Neo4j之聚合函数(五)
目录聚合Aggregation 计数计算节点数分组计算关系类型计算实体数计算非空可以值数求和sum 平均值avg 最大值max 最小值min 聚类COLLECT 相异DISTINCT 聚合 ...
使用Django实现分页器功能
要使用Django实现分页器,必须从Django中导入Paginator模块 from django.core.paginator import Paginator 假如现在有150条记录要显示,每页 ...

python 爬取糗事百科 gui小程序

python 爬取糗事百科 gui小程序的更多相关文章

随机推荐

热门专题