Python爬虫获取迅雷会员帐号

代码如下：

 import re

 import urllib.request

 import urllib

 import time

 from collections import deque

 head = {

     'Connection': 'Keep-Alive',

     'Accept': 'text/html, application/xhtml+xml, */*',

     'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',

     'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'

 }

 visited = set()

 url = 'http://xlfans.com'  # 入口页面, 可以换成别的

 data = None

 full_url=urllib.request.Request(url,data,head)

 urlop = urllib.request.urlopen(full_url)

 data = urlop.read().decode('utf-8')

 temp = re.search(r'href=\"http://xlfans.com/archives/(.{4})\" class=\"thumbnail\">(.*) alt=\"迅雷粉 (.*) 迅雷会员账号分享 共享中', data, re.M|re.I)

 result = re.search(r'href=\"http://xlfans.com/archives/(.{4})', temp.group(), re.M|re.I)

 url = url + "/archives/" + temp.group(1)

 data = None

 full_url=urllib.request.Request(url,data,head)

 urlop = urllib.request.urlopen(full_url)

 data = urlop.read().decode('utf-8')

 save_path = 'D:\\Program Files\\python\\test.txt'

 f_obj = open(save_path, 'w')

 #获取系统时间，来判断是否为周末

 cur_day = time.strftime("%w",time.localtime(time.time()))

 if(cur_day == ''):

     string = "迅雷粉周末迅雷会员账号"

 elif cur_day == '':

     string = "迅雷粉周末迅雷会员账号"

     print(cur_day)

 else:

     string = "迅雷粉专享迅雷会员账号"

 #娘的，是你逼我的

 start = data.find(string)

 data = data[start:]

 data_que = data.split("</p>")

 count = 0

 for i in range(3):

     data_temp = data_que[i]

     num = -1

     acc_que = data_temp.split("<br />")

     for result in acc_que:

         num = num + 1

         if(count != 0):

             if(num == 0):

                 continue

         f_obj.write(result)

         f_obj.write("\n")

     count = count + 1

 f_obj.close()

Python爬虫获取迅雷会员帐号的更多相关文章

迅雷VIP帐号获取小工具
自己写的迅雷vip帐号获取工具,主要是熟悉一下正则表达式下载地址: 迅雷VIP获取工具另附vip防踢补丁,不能使用最新迅雷,我使用的是迅雷尊享版2.0.12.258,使用了一段时间,至少没被踢出来 ...
dedecms--二次开发之会员帐号过期无法登录
最近在二次开发织梦系统的会员功能:要求会员帐号有期限,开始时间以会员添加时间为开始,这样登录的时候需要判断帐号是否过期,原本的织梦系统中是通过$rs = $cfg_ml->CheckUser($ ...
[Python]爬虫获取知乎某个问题下所有图片并去除水印
获取URL 进入某个知乎问题的主页下,按F12打开开发者工具后查看network面板. network面板可以查看页面向服务器请求的资源.资源的大小.加载资源花费的时间以及哪些资源加载失败等信息.还可 ...
如何科学地蹭热点：用python爬虫获取热门微博评论并进行情感分析
前言:本文主要涉及知识点包括新浪微博爬虫.python对数据库的简单读写.简单的列表数据去重.简单的自然语言处理(snowNLP模块.机器学习).适合有一定编程基础,并对python有所了解的盆友阅读 ...
Python爬虫获取知乎图片
前段时间想抓点知乎问题中的图片,了解了下爬虫,发现还是Python的简单方便,于是做了点尝试. #coding=utf-8 import urllib import re def getHtml(ur ...
Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3)
1. 异步加载爬虫对于静态页面爬虫很容易获取到站点的数据内容,然而静态页面需要全量加载站点的所有数据,对于网站的访问和带宽是巨大的挑战,对于高并发和大访问访问量的站点来说,需要使用AJAX相关的技术 ...
python爬虫获取百度图片（没有精华，只为娱乐）
python3.7,爬虫技术,获取百度图片资源,msg为查询内容,cnt为查询的页数,大家快点来爬起来.注:现在只能爬取到百度的小图片,以后有大图片的方法,我会陆续发贴. #!/usr/bin/env ...
Python爬虫获取百度贴吧图片
#!/usr/bin/python# -*- coding: UTF-8 -*-import urllibimport re文章来源:https://www.cnblogs.com/Axi8/p/57 ...
【原创】python爬虫获取网站数据并存入本地数据库
#coding=utf-8 import urllib import re import MySQLdb dbnumber = MySQLdb.connect('localhost', 'root', ...

随机推荐

【POJ3237】【树链剖分】Tree
Description You are given a tree with N nodes. The tree’s nodes are numbered 1 through N and its edg ...
Hdu 2874 Connections between cities
题意: 城市道路没有环不一定连通的树求两城市的最短距离设想一下就是很多小树那好办思路: lca离线算法然后有个技巧就是每次我们tarjan一棵树不是最后树的节点都访问过并且孩子全 ...
linux下svn客户端报错Cannot negotiate authentication mechanism的解决方法
svn客户端报错Cannot negotiate authentication mechanism的解决方法: 问题出现的原因之一: 因为SVN服务器配置了saslauthd服务用来实现与ldap的对 ...
测试通过Word直接发布博文
这里是来自word 2013的一篇测试文章. 测试直接通过Word自带的bloger功能发布博客文章. 这里插入一张图片
js动态加载脚本
最近公司的前端地图产品需要做一下模块划分,希望用户用到哪一块的功能再加载哪一块的模块,这样可以提高用户体验. 所以到处查资料研究js动态脚本的加载,不过真让人伤心啊!,网上几乎都是同一篇文章,4种方法 ...
HTML部分标签的含义
标签的用途:我们学习网页制作时,常常会听到一个词,语义化.那么什么叫做语义化呢,说的通俗点就是:明白每个标签的用途(在什么情况下使用此标签合理)比如,网页上的文章的标题就可以用标题标签,网页上的各个栏 ...
SignalR实现B/S系统对windows服务运行状态的监测
基于SignalR实现B/S系统对windows服务运行状态的监测通常来讲一个BS项目肯定不止单独的一个BS应用,可能涉及到很多后台服务来支持BS的运行,特别是针对耗时较长的某些任务来说,Windo ...
ios+oc面试题
ios+oc面试题浅复制和深复制的区别?//浅拷贝和深拷贝答案:浅层复制(copy):只复制指向对象的指针,而不复制引用对象本身.//通过对象的指针来访问这个对象深层复制(mutableCo ...
转:2014年最酷的30个JavaScript库
原文来自于:http://www.gbtags.com/gb/share/3701.htm 使用JavaScript库将会使开发变的更简单,大部分JavaScript库提供的功能都是极好的,当我们在为 ...
CVE-2015-1635，MS15-034 漏洞测试
HTTP.sys远程执行代码漏洞(CVE-2015-1635,MS15-034) 远程执行代码漏洞存在于 HTTP 协议堆栈 (HTTP.sys) 中,当 HTTP.sys 未正确分析经特殊设计的 H ...

Python爬虫获取迅雷会员帐号

Python爬虫获取迅雷会员帐号的更多相关文章

随机推荐

热门专题