抓取百度音乐频道歌曲url

参考了 http://blog.csdn.net/banguijun/article/details/11815263

后写了一个抓取fm音乐url的模块，得到所有频道歌曲的url。缺点是百度会变更url地址，失效后需要重新获取。话不多说上代码：

# -*- coding: UTF-8 -*-

'''

Created on 2013-12-3

从百度的频道中抓取歌曲的下载地址

@author:

'''

import urllib

import json

SAVEPATH='/home/gfc/musiclistnew.txt' # defines the storage location 定义存储位置 用时要修改为自己的文件存放地址

getlisturl = "http://fm.baidu.com/dev/api/?tn=playlist&format=json&id=" #get list url   获取频道列表url

getmusicrealurl = 'http://music.baidu.com/data/music/fmlink?type=mp3&rate=320&songIds=' #获取歌曲地址url

html = urllib.urlopen("http://fm.baidu.com/").read().decode("utf-8")

start = html.find("{", html.find("rawChannelList"))  # find javascript code of the channel list urls

end = html.find(";", start)

listjson = html[start:end].strip()  # cut spaces to get channel list json

data = json.loads(listjson)  # parse json

channel_id_list = []

for item in data['channel_list']:

#     print "Channel Name:\t", item['channel_name'], "Category:\t", item['cate']

    channel_id_list.append(item['channel_id'])  # get channel id

musiclistfile = open(SAVEPATH, 'w') # open file

for channel_id in channel_id_list:#循环频道列表

    musiclist = urllib.urlopen(getlisturl + channel_id).read().decode("utf-8")

    musicidslist = json.loads(musiclist)['list']

    musicUrlList = []

    for songid in musicidslist:#遍历频道歌曲列表

        getMusicUrls = urllib.urlopen(getmusicrealurl + str(songid['id'])).read()

        urlmusic = json.loads(getMusicUrls)

        musicUrl = urlmusic['data']['songList']

        for songlink in musicUrl:#取得歌曲url并写入文本文件

            musiclistfile.write(songlink['songLink'])

            musiclistfile.write('\n')

musiclistfile.close()

抓取百度音乐频道歌曲url的更多相关文章

使用浏览器抓取QQ音乐接口(歌曲篇)
前言前面我们获取了歌曲的排行榜的数据,我们现在需要实现歌曲播放前面我们写了一段函数来得到了回调的数据,现在我们需要使用这一段数据,来实现播放歌曲完整代码 <!DOCTYPE html> ...
python 抓取百度音乐
# coding:utf-8 import urllib2 import re import urllib import chardet from json import * category = ' ...
requests爬取百度音乐
使用requests爬取百度音乐,我想把当前热门歌手的音乐信息爬下来. 首先进行url分析,可以看到: 歌手网页: 薛之谦网页: 可以看到,似乎这些路劲的获取一切都很顺利,然后可以写代码: # -*- ...
Python抓取百度百科数据
前言本文整理自慕课网<Python开发简单爬虫>,将会记录爬取百度百科"python"词条相关页面的整个过程. 抓取策略确定目标:确定抓取哪个网站的哪些页面的哪部分 ...
python3 - 通过BeautifulSoup 4抓取百度百科人物相关链接
导入需要的模块需要安装BeautifulSoup from urllib.request import urlopen, HTTPError, URLError from bs4 import Be ...
C#.Net使用正则表达式抓取百度百家文章列表
工作之余,学习了一下正则表达式,鉴于实践是检验真理的唯一标准,于是便写了一个利用正则表达式抓取百度百家文章的例子,具体过程请看下面源码: 一:获取百度百家网页内容 public List<str ...
用PHP抓取百度贴吧邮箱数据
注:本程序可能非常适合那些做百度贴吧营销的朋友. 去逛百度贴吧的时候,经常会看到楼主分享一些资源,要求留下邮箱,楼主才给发. 对于一个热门的帖子,留下的邮箱数量是非常多的,楼主需要一个一个的去复制那些 ...
Python爬虫之小试牛刀——使用Python抓取百度街景图像
之前用.Net做过一些自动化爬虫程序,听大牛们说使用python来写爬虫更便捷,按捺不住抽空试了一把,使用Python抓取百度街景影像. 这两天,武汉迎来了一个德国总理默克尔这位大人物,又刷了一把武汉 ...
Python3---爬虫---抓取百度贴吧
前言该文章主要描述如何抓取百度贴吧内容.当然是简单爬虫实现功能,没有实现输入参数过滤等辅助功能,仅供小白学习. 修改时间:20191219 天象独行 import os,urllib.request ...

随机推荐

javascript网址收集
1.模块的写法http://www.ruanyifeng.com/blog/2012/10/javascript_module.html 2.模块规范 AMDhttp://www.ruanyifeng ...
spring mvc 删除返回字符串中值为null的字段
在spring的配置文件中进行一下配置: <bean class="org.springframework.web.servlet.mvc.method.annotation.Requ ...
Unsupported major.minor version 51.0解决办法
问题: 之前使用的是高版本的myeclipse2015ci,然后换成了myeclipse10.5,之前的workspace的内容没有改变,结果工程都出现了感叹号,运行时提示 Unsupported m ...
Why is Visual Studio 2015 not able to find or open PDB files?
first change parameters, Tools->Options->Debugging->Symbols->Microsoft Symbol Server, ye ...
openlayers中实现自定冒泡的效果
自定义的Openlayers.Popup.FreshCloud继承自Openlayers.Popup.Framed,实现了比较简洁的冒泡效果,详细代码如下 /** * Class: OpenLayer ...
标准C++中的string类的用法总结
标准C++中的string类的用法总结相信使用过MFC编程的朋友对CString这个类的印象应该非常深刻吧?的确,MFC中的CString类使用起来真的非常的方便好用.但是如果离开了MFC框架,还有 ...
XML文档
XML(Extensible Markuo Language)可标记扩展语言.它是一种以简单文本格式存储数据的方式,可以被任何计算机读取. XML文档里包含的元素都是可以自定义的. 1.XML文档声明 ...
Java设计模式1——策略模式（Strategy Pattern）
最近觅得一本好书<您的设计模式>,读完两章后就能断言,一定是一头极品屌丝写的,而且是专写给开发屌丝男的智慧枕边书,小女子就委屈一下,勉强看看,人笨,谁让他写得这么通俗易懂呢!为了加深理解, ...
（Hibernate进阶）Hibernate映射——一对一双向关联映射（六）
上一篇博客我们介绍了一对一的单向关联映射,单向是指只能从人(Person)这端加载身份证端(IdCard),但是反过来,不能从身份证端加载人得信息.如图所示: 关键原因在于对象模型具有方向性: 单向: ...
jQuery检测滚动条(scroll)是否到达底部
一.jQuery检测浏览器window滚动条到达底部 jQuery获取位置和尺寸相关函数: $(document).height() 获取整个页面的高度 $(window).height() ...

抓取百度音乐频道歌曲url

抓取百度音乐频道歌曲url的更多相关文章

随机推荐

热门专题