Python一日一练05----怒刷点击量

功能

自己主动获取CSDN文章列表，并对每篇文章添加点击量.

源代码

import urllib.request

import re

import time

import random

from bs4 import BeautifulSoup

p = re.compile('/a359680405/article/details/........')

#自己的博客主页

url = "http://blog.csdn.net/a359680405"

#使用build_opener()是为了让python程序模仿浏览器进行訪问

opener = urllib.request.build_opener()

opener.addheaders = [('User-agent', 'Mozilla/5.0')]

html = opener.open(url).read().decode('utf-8')

allfinds = p.findall(html)

print(allfinds)

urlBase = "http://blog.csdn.net"#须要将网址合并的部分

#页面中的网址有反复的，须要使用set进行去反复

mypages = list(set(allfinds))

for i in range(len(mypages)):

    mypages[i] = urlBase+mypages[i]

print('要刷的网页有：')

for index , page in enumerate(mypages) :

    print(str(index), page)

#设置每一个网页要刷的次数

brushMax = 200

#全部的页面都刷

print('以下開始刷了哦：')

for index , page in enumerate(mypages) :

    brushNum=random.randint(0,brushMax)

    for j in range(brushNum):

        try :

            pageContent = opener.open(page).read().decode('utf-8')

            #使用BeautifulSoup解析每篇博客的标题

            soup = BeautifulSoup(pageContent)

            blogTitle = str(soup.title.string)

            blogTitle = blogTitle[0:blogTitle.find('-')]

            print(str(j) , blogTitle) 

        except urllib.error.HTTPError:

            print('urllib.error.HTTPError')

            time.sleep(1)#出现错误。停几秒先

        except urllib.error.URLError:

            print('urllib.error.URLError')

            time.sleep(1)#出现错误，停几秒先

        time.sleep(0.1)#正常停顿，以免server拒绝訪问

Python一日一练05----怒刷点击量的更多相关文章

selenium+chromedriver刷点击量
#coding=utf-8 import re import time import json import requests from selenium import webdriver from ...
python通过代理刷网页点击量
python通过代理刷网页点击量更新异常处理情况 @time 2013-0803 更新循环里计数问题和随机等待时间问题 #!/usr/bin/python #-*- coding:utf-8 -*- ...
Python全栈day 05
Python全栈day 05 一.数据类型补充 1. int py2和py3的2种区别 py2有int和long,int的取值范围为-2^31~2^31-1,超出范围自动转为long,长整型. py2 ...
Halcon一日一练：读取文件目录图像的三种方法
第一种方法: 读了一个单一图像: read_image(Image,'fabrik') 这种方式可以快速的读取软件自身携带的库图像文件,系统设定了库图像映像文件的快速读取方式,我们也可以通过绝对地址的 ...
python每日一练：0007题
第 0007 题: 有个目录,里面是你自己写过的程序,统计一下你写过多少行代码.包括空行和注释,但是要分别列出来. # -*- coding:utf-8 -*- import os def count ...
[python每日一练]--0012:敏感词过滤 type2
题目链接:https://github.com/Show-Me-the-Code/show-me-the-code代码github链接:https://github.com/wjsaya/python ...
Python 每日一练 | Flask 实现半成品留言板
留言板Flask实现引言看了几天网上的代码,终于写出来一个半成品的Flask的留言板项目,为什么说是半成品呢?因为没能实现留言板那种及时评论刷新的效果,可能还是在重定向上有问题或者渲染写的存在问 ...
Python 每日一练(5)
引言 Python每日一练又开始啦,今天的专题和Excel有关,主要是实现将txt文本中数据写入到Excel中,说来也巧,今天刚好学校要更新各团支部的人员信息,就借此直接把事情做了主要对于三种数据类 ...
Python 每日一练（4）
引言今天继续是python每日一练的几个专题,主要涵盖简单的敏感词识别以及图片爬虫敏感词识别这个敏感词的识别写的感觉比较简单,总的概括之后感觉功能可以简略成if filter_words in ...

随机推荐

[Angular 2] Interpolation: check object exists
In Angular2, sometime we use @Output to pass data to parent component, then parent may pass the data ...
移动web开发框架研究
纯粹的总结一下移动web开发框架,移动web开发框架有jQuery Mobile .Sencha Touch等等,他们都来源于web开发,是成熟的框架.jQuery Mobile出自于jQuery家族 ...
scrollTop,scrollLeft
document.body.scrollTop用法网页可见区域宽: document.body.clientWidth;网页可见区域高: document.body.clientHeight;网页可 ...
DataGrid( 数据表格) 组件[6]
本节课重点了解 EasyUI 中 DataGrid(数据表格)组件的使用方法,这个组件依赖于Panel(面板).Resizeable(调整大小).LinkButton(按钮).Pageination( ...
mvc自带的异步表单提交
using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.We ...
document.documentElement和document.body区别
body是DOM对象里的body子节点,即body标签, documentElement 是整个节点树的根节点root, 详细介绍请看本文,感兴趣的朋友可以参考下区别: body是DOM对象里的 ...
Asp.Net WebAPI传递json对象、后台手动接收参数
1.前台代码 /* * 跨域请求Post * 1个对象参数,后台JObject接受 */ $.post(apiUrl.getOne("PostFourth"), { name: } ...
【socket.io研究】1.官网的一些相关说明，概述
socket.io是什么? 官网的解释是一个实时的,基于事件的通讯框架,可以再各个平台上运行,关注于效率和速度. 在javascript,ios,android,java中都实现了,可以很好的实现实时 ...
Oracle怎样方便地查看报警日志错误
由于报警日志文件很大,而每天都应该查看报警日志(查看有无“ORA-”,Error”,“Failed”等出错信息),故想找到一种比较便捷的方法,查看当天报警日志都有哪些错误. 在网上查了几天的资料,尝试 ...
polya定理小结
polya的精髓就在与对循环节的寻找,其中常遇到的问题就是项链染色类问题. 当项链旋转时有n种置换,循环节的个数分别是gcd(n, i); 当项链翻转时有n种置换,其中当项链珠子数位奇数时,循环节的个 ...

Python一日一练05----怒刷点击量

功能

源代码

Python一日一练05----怒刷点击量的更多相关文章

随机推荐

热门专题