python刷取CSDN博文访问量之三

python刷取CSDN博文访问量之三

作者:vpoet
注:这个系列我只贴代码,代码不注释.有兴趣的自己读读就懂了,纯属娱乐,望管理员抬手
若有转载一定不要注明来源

 #coding=utf-8

 import webbrowser

 import time

 import urllib2

 import re

 import os

 import thread

 import threading

 mylock = threading.RLock()  

 tabcount=1

 def BlogFun(n,url,MaxVisitor):

     visitcount = r'<span class="link_view" title="阅读次数">(\d+)人阅读</span>'

     global tabcount

     while True:

         mylock.acquire()

         if tabcount >10:

             os.system('taskkill /F /IM chrome.exe')

             tabcount = 1

         else:

             tabcount = tabcount + 1

         mylock.release()

         webbrowser.open(url,new=1)

         request=urllib2.Request(url)

         request.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6')

         opener = urllib2.build_opener()

         fblog = opener.open(request)

         htm = fblog.read()

         Ref=re.findall(visitcount,htm);

         #print url+": "+str(int(Ref[0]))+"人阅读"

         if int(Ref[0])>MaxVisitor:

             break

         time.sleep(n)

 if __name__=="__main__":

     Domain="http://blog.csdn.net"

     main_url = "http://blog.csdn.net/u013018721"

     patt_article = r'<span class="link_title"><a href="(.+)">'

     Mainrequest=urllib2.Request(main_url)

     Mainrequest.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6')

     opener = urllib2.build_opener()

     fMainblog = opener.open(Mainrequest)

     Mainhtml= fMainblog.read()

     article_urls = re.findall(patt_article,Mainhtml)

     threadnumber = 1

     MaxVisitor = 300

     timedelay=3

     for item in article_urls:

         Realurl =  Domain+item

         thread.start_new_thread(BlogFun,(timedelay,Realurl,MaxVisitor,))

         threadnumber=threadnumber+1

python刷取CSDN博文访问量之三的更多相关文章

python刷取CSDN博文访问量之四
python刷取CSDN博文访问量之四作者:vpoet #coding:utf-8 import requests import urllib2 import re import time def ...
python刷取CSDN博文访问量之二
python刷取CSDN博文访问量之二作者:vpoet 注:这个系列我只贴代码,代码不注释.有兴趣的自己读读就懂了,纯属娱乐,望管理员抬手若有转载一定不要注明来源 #coding=utf ...
python刷取CSDN博文访问量之一
python刷取CSDN博文访问量之一作者:vpoet 注:这个系列我只贴代码,代码不注释.有兴趣的自己读读就懂了,纯属娱乐,望管理员抬手若有转载一定不要注明来源 #coding=utf-8 ...
Python爬取CSDN博客文章
0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.win ...
使用python抓取CSDN关注人的全部公布的文章
# -*- coding: utf-8 -*- """ @author: jiangfuqiang """ import re import ...
利用Python抓取CSDN博客
这两天发现了一篇好文章,陈皓写的makefile的教程,具体地址在这里<跟我一起写makefile> 这篇文章一共分成了14个部分,我看东西又习惯在kindle上面看,感觉一篇一篇地复制成 ...
Python 爬取CSDN博客频道
初次接触python,写的很简单,开发工具PyCharm,python 3.4很方便 python 部分模块安装时需要其他的附属模块之类的,可以先 pip install wheel 然后可以直接下载 ...
[Python]爬取CSDN论坛标题 2020.2.8
首先新建一个Lei.txt 内容为: CloudComputingParentBlockchainTechnologyEnterpriseDotNETJavaWebDevelopVCVBDelphiB ...
[Python学习] 简单爬取CSDN下载资源信息
这是一篇Python爬取CSDN下载资源信息的样例,主要是通过urllib2获取CSDN某个人全部资源的资源URL.资源名称.下载次数.分数等信息.写这篇文章的原因是我想获取自己的资源全部的评论信息. ...

随机推荐

UVa 1449 - Dominating Patterns (AC自动机)
题目大意:给出多个字符串模板,并给出一个文本串,求在文本串中出现最多的模板,输出最多的次数并输出该模板(若有多个满足,则按输入顺序输出). 思路:赤裸裸的 AC自动机,上模板. 代码: #includ ...
线段树（build，insert，dfs操作）
模板原型: 解决零散数点在已知线段上的出现次数.思想是将线段用长线覆盖,将长线转化成线段树.用权值记录各个数点出现的次数,最后进行查询.代码解释见注释. #include <bits/stdc+ ...
javascrpit开发连连看记录-小游戏
工作之余,总想做点什么有意思的东西.但是苦于不知道做什么,也就一直没有什么动作.在一个午饭后,跟@jedmeng和@墨尘聊天过程中,发现可以写一些小东西来练练手,有以下几点好处: 1. ...
Android应用开发学习之状态栏通知
作者:刘昊昱博客:http://blog.csdn.net/liuhaoyutz 状态栏通知涉及到两个类,一是Notification,它代表一个通知:另一个是NotificationManager ...
STS(Spring Tool Suite)使用前准备
sts 的基础框架拿的eclipse的,你可以理解为eclipse + spring插件的高级升华版.在使用上可以很大限度的参考eclipse的操作. 首先,调整字体. 中文很麻烦的,因为编码问题.习 ...
java算法之冒泡排序法
由此可见:N个数字要排序完成,总共进行N-1趟排序,每第 i 趟的排序次数为 (N-i) 次,所以可以用双重循环语句,外层控制循环多少趟,内层控制每一趟的循环次数,即 for(inti=0;i& ...
百度地图 Android SDK - 检索功能使用的简单演示样例
百度地图 SDK 不仅为广大开发人员提供了炫酷的地图展示效果.丰富的覆盖物图层,更为广大开发人员提供了多种 LBS 检索的能力. 通过这些接口,开发人员能够轻松的訪问百度的 LBS 数据,丰富自己的移 ...
【Struts2】新建一个Struts2工程，初步体验MVC
实现目标地址栏输入http://localhost:88/Struts2HelloWorld/helloworld.jsp 输入用户名,交由http://localhost:88/Struts2He ...
[RxJS] Reactive Programming - Why choose RxJS?
RxJS is super when dealing with the dynamic value. Let's see an example which not using RxJS: var a ...
EEPlat vs saleforce 配置 Knowledge Article 演示样例
==================================================================================================== ...

python刷取CSDN博文访问量之三

python刷取CSDN博文访问量之三的更多相关文章

随机推荐

热门专题