python定时器爬取豆瓣音乐Top榜歌名

python定时器爬取豆瓣音乐Top榜歌名

作者:vpoet

mail:vpoet_sir@163.com

注:这些小demo都是前段时间为了学python写的,现在贴出来纯粹是为了和大家分享一下

 #coding=utf-8

 import urllib

 import urllib2

 import re

 import time 

 def SaveTop20Music(currtime):

     rex=r'<a href="javascript:;">(.*?)</a>';

     url = 'http://music.douban.com/chart';

     Response = urllib2.urlopen(url);

     Html=Response.read();

     listsofsong = re.findall(rex, Html);

     print len(listsofsong);

     f=open('%s.txt' % currtime,'w');

     x=1;

     for line in listsofsong:

         f.write('top'+str(x)+':'+line);

         f.write('\n');

         x=x+1;

         f.flush();

     f.close();

     print currtime+'.txt'+'\t\t'+'SaveOver'

 def timer(n):

     while True:

         currtime = time.strftime("Savetime_%H-%M-%S", time.localtime())

         print currtime

         SaveTop20Music(currtime)

         time.sleep(n) 

 if __name__ == "__main__":

     timer(5)

运行截图:

python定时器爬取豆瓣音乐Top榜歌名的更多相关文章

Python爬虫：现学现用xpath爬取豆瓣音乐
爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比. 这样一比较我我选择了Lxml(xpa ...
爬虫系列1：Requests+Xpath 爬取豆瓣电影TOP
爬虫1:Requests+Xpath 爬取豆瓣电影TOP [抓取]:参考前文爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html [分页]: ...
爬取豆瓣电影TOP 250的电影存储到mongodb中
爬取豆瓣电影TOP 250的电影存储到mongodb中 1.创建项目sp1 PS D:\scrapy> scrapy.exe startproject douban 2.创建一个爬虫 PS D: ...
爬虫——正则表达式爬取豆瓣电影TOP前250的中英文名
正则表达式爬取豆瓣电影TOP前250的中英文名 1.首先要实现网页的数据的爬取.新建test.py文件 test.py 1 import requests 2 3 def get_Html_text( ...
Python爬取豆瓣音乐存储MongoDB数据库(Python爬虫实战1)
1. 爬虫设计的技术 1)数据获取,通过http获取网站的数据,如urllib,urllib2,requests等模块: 2)数据提取,将web站点所获取的数据进行处理,获取所需要的数据,常使用的技 ...
Python爬虫小白入门（七）爬取豆瓣音乐top250
抓取目标: 豆瓣音乐top250的歌名.作者(专辑).评分和歌曲链接使用工具: requests + lxml + xpath. 我认为这种工具组合是最适合初学者的,requests比pytho ...
Python开发爬虫之静态网页抓取篇：爬取“豆瓣电影 Top 250”电影数据
所谓静态页面是指纯粹的HTML格式的页面,这样的页面在浏览器中展示的内容都在HTML源码中. 目标:爬取豆瓣电影TOP250的所有电影名称,网址为:https://movie.douban.com/t ...
Python爬取豆瓣电影top
Python爬取豆瓣电影top250 下面以四种方法去解析数据,前面三种以插件库来解析,第四种以正则表达式去解析. xpath pyquery beaufifulsoup re 爬取信息:名称评分 ...
Python爬虫爬取豆瓣电影之数据提取值xpath和lxml模块
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统.谷歌浏览器目的:爬取豆瓣电影排行榜中电影的title.链接地址.图片.评价人数.评分等网址:https:// ...

随机推荐

（转载） C/C++编译和链接过程详解 (重定向表，导出符号表，未解决符号表)
转载http://blog.csdn.net/neo_ustc/article/details/9024839 有些人写C/C++(以下假定为C++)程序,对unresolved external ...
ZooKeeper架构设计及其应用
ZooKeeper是一个开源的分布式服务框架,它是Apache Hadoop项目的一个子项目,主要用来解决分布式应用场景中存在的一些问题,如:统一命名服务.状态同步服务.集群管理.分布式应用配置管理等 ...
AFN的二次封装
http://www.cnblogs.com/sxwangjiadong/p/4970751.html
ARC 工作原理
自动引用计数(Automatic Reference Counting),是一个编译期间工作的能够帮你管理内存的技术. ARC在编译期间为每个Objective-C指针变量添加合适的retain, r ...
ASP.NET中时间的绑定和格式化
1.Eval和Bind的区别绑定表达式 <%# Eval("字段名") %> <%# Bind("字段名") %> 区别 1.e ...
Firebase远程更新应用
能打造出色的应用不意味着一定能在商业上取得成功,两者之间还有许多工作要做,绝不能简单发布应用后就宣告“收工”.您需要能迅速根据用户反馈作出调整.测试新功能,以及向用户提供他们最关注的内容. Fireb ...
NET中级课--设计模式1
1.分类创建型结构型行为型 2.总体思路使用接口和抽象类 3.创建型工厂: 单例:整个系统中对象是唯一的或固定数目的对象如对象池 4.结构型
I - u Calculate e
Description A simple mathematical formula for e is where n is allowed to go to infinity. This can ac ...
(转)Ubuntu中让终端对于历史输出的内容保持足够长
原地址:http://www.crifan.com/ubuntu_terminal_make_retain_long_enough_history_output_content/ Ubuntu下用终端 ...
安装ubuntu14.10系统的那些瞎折腾
前段时间自作孽,安装了ubuntu14.04的64位系统,而我的笔记本又是那种老古董,2G的内存所以装好之后各种不稳定,索性这个周末就重装一下吧,本来打算是直接装我以前的那个ubuntu12.04-i ...

python定时器爬取豆瓣音乐Top榜歌名

python定时器爬取豆瓣音乐Top榜歌名的更多相关文章

随机推荐

热门专题