抓取QQ音乐歌单

抓取QQ音乐歌单

1.通过分析歌曲下载路径来分析所需参数： 通过比较， 得出其中歌曲下载url与参数vkey是可变的，
歌曲下载url中可变得值是请求歌单返回的歌曲数据的strMediaMid参数, 而vkey是通过请求歌单返回的歌曲数据的songmid参数再次请求另一个url返回vkey值
2.通过分析请求歌单url来分析所需参数: dissid  
dissid为请求diss的返回数据中的dissid参数

import os

import re

import requests

from urllib.parse import urlencode

headers = {

    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',

    'origin': 'https://y.qq.com',

    'referer': 'https://y.qq.com/portal/playlist.html'

}

def fetch_url(url):

    try:

        r = requests.get(url, headers=headers)

        if r.status_code in [200, 201]:

            return r.json()

    except Exception as e:

        print(e)

def down_song(path, strMediaMid, vkey):

    params = {

        'guid': '5300386295',

        'vkey': vkey,

        'uin': '0',

        'fromtag': '66'

    }

    url = 'http://222.73.132.154/amobile.music.tc.qq.com/C400{}.m4a?'.format(strMediaMid)

    url += urlencode(params)

    r = requests.get(url, headers=headers)

    if r.status_code in [200, 201]:

        with open(path, 'wb') as f:

            f.write(r.content)

def get_vkey(songmid):

    url = 'https://u.y.qq.com/cgi-bin/musicu.fcg?'

    params = {

        '-': 'getplaysongvkey7256617694143965',

        'g_tk': '5381',

        'loginUin': '0',

        'hostUin': '0',

        'format': 'json',

        'inCharset': 'utf8',

        'outCharset': 'utf-8',

        'notice': '0',

        'platform': 'yqq.json',

        'needNewCode': '0',

        'data': '{"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"5300386295","songmid":["%s"],"songtype":[0],"uin":"0","loginflag":1,"platform":"20"}},"comm":{"uin":0,"format":"json","ct":24,"cv":0}}' % songmid

    }

    url += urlencode(params)

    result = fetch_url(url)

    vkey = result['req_0']['data']['midurlinfo'][0]['vkey']

    return vkey

def get_song_info(disstid):

    url = 'https://c.y.qq.com/qzone/fcg-bin/fcg_ucc_getcdinfo_byids_cp.fcg?'

    params = {

        'type': '1',

        'json': '1',

        'utf8': '1',

        'onlysong': '0',

        'disstid': disstid,

        'g_tk': '5381',

        'loginUin': '0',

        'hostUin': '0',

        'format': 'json',

        'inCharset': 'utf8',

        'outCharset': 'utf-8',

        'notice': '0',

        'platform': 'yqq.json',

        'needNewCode': '0',

    }

    url += urlencode(params)

    result = fetch_url(url)

    songlist = result['cdlist'][0]['songlist']

    for song in songlist:

        strMediaMid = song['strMediaMid']

        songMid = song['songmid']

        songname = song['songname']

        yield strMediaMid, songMid, songname

def get_dist_info(page):

    url = 'https://c.y.qq.com/splcloud/fcgi-bin/fcg_get_diss_by_tag.fcg?'

    params = {

        'picmid': '1',

        'rnd': '0.15993662911508766',

        'g_tk': '5381',

        'loginUin': '0',

        'hostUin': '0',

        'format': 'json',

        'inCharset': 'utf8',

        'outCharset': 'utf-8',

        'notice': '0',

        'platform': 'yqq.json',

        'needNewCode': '0',

        'categoryId': '10000000',

        'sortId': '5',

        'sin': int(page)*30-30,

        'ein': int(page)*30-1,

    }

    url += urlencode(params)

    result = fetch_url(url)

    disslist = result['data']['list']

    for diss in disslist:

        yield diss['dissid'], diss['dissname']

def main(page):

    for item in get_dist_info(page):

        dissid, dissname = item

        for item in get_song_info(dissid):

            strMediaMid, songMid, songname = item

            vkey = get_vkey(songMid)

            pattern = re.compile(r'[\\/:：*?"<>|\r\n]+')

            songname = re.sub(pattern, " ", songname)

            dissname = re.sub(pattern, " ", dissname)

            if not os.path.exists('d://data/{}/'.format(dissname)):

                os.mkdir('d://data/{}/'.format(dissname))

            path = 'd://data/{0}/{1}.m4a'.format(dissname, songname)

            print("正在下载：{}".format(songname))

            down_song(path, strMediaMid, vkey)

            print("下载完成：{}".format(songname))

if __name__ == '__main__':

    page = 1

    main(page)

抓取QQ音乐歌单的更多相关文章

通过Scrapy抓取QQ空间
毕业设计题目就是用Scrapy抓取QQ空间的数据,最近毕业设计弄完了,来总结以下: 首先是模拟登录的问题: 由于Tencent对模拟登录比较讨厌,各个防备,而本人能力有限,所以做的最简单的,手动登录后 ...
一篇文章教会你用Python抓取抖音app热点数据
今天给大家分享一篇简单的安卓app数据分析及抓取方法.以抖音为例,我们想要抓取抖音的热点榜数据. 要知道,这个数据是没有网页版的,只能从手机端下手. 首先我们要安装charles抓包APP数据,它是一 ...
利用libpcap抓取QQ号码信息
最近想在QQ登录时把QQ号码信息记录下来,百度了很多都没有找到具体方式,最近用Wireshark分析报文+libpcap库嗅探实现了这个小功能. 通讯背景: QQ客户端在通讯时使用UDP协议,其中数据 ...
抓取QQ空间相册
某天,想下载某人的相册,发现一张一张下载,工作量巨大,所以写了这个工具. 使用到的工具 Fiddler(抓包工具) python(脚本语言) intellij 步骤分析包获取相册分类链接信息打开 ...
Python爬虫实战：使用Selenium抓取QQ空间好友说说
前面我们接触到的,都是使用requests+BeautifulSoup组合对静态网页进行请求和数据解析,若是JS生成的内容,也介绍了通过寻找API借口来获取数据. 但是有的时候,网页数据由JS生成,A ...
手把手教你使用Python抓取QQ音乐数据（第一弹）
[一.项目目标] 获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 由浅入深,层层递进,非常适合刚入门的同学练手. [二.需要的库] 主要涉及的库有:requests.json ...
手把手教你使用Python抓取QQ音乐数据（第二弹）
[一.项目目标] 通过Python爬取QQ音乐数据(一)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 此次我们在之前的基础上获取QQ音乐指定歌曲的歌词及前15个精 ...
python+fiddler 抓取抖音数据包并下载抖音视频
这个我们要下载视频,那么肯定首先去找抖音视频的url地址,那么这个地址肯定在json格式的数据包中,所以我们就去专门查看json格式数据包这个怎么找我就不用了,直接看结果吧你找json包,可以选大 ...
wireshark抓取qq数据包
抓包接口设置成本地连接点击start,登录qq,输入oicq进行过滤qq包找到第一个OICQ,点击后,点击oicq-IM software 可以看到自己登录的QQ号码为765343409 本机IP ...

随机推荐

Linux简单Shell脚本监控MySQL、Apache Web和磁盘空间
Linux简单Shell脚本监控MySQL.Apache Web和磁盘空间 1. 目的或任务当MySQL数据库.Apache Web服务器停止运行时,重新启动运行,并发送邮件通知: 当服务器磁盘的空 ...
Js中函数式编程的理解
函数式编程的理解函数式编程是一种编程范式,可以理解为是利用函数把运算过程封装起来,通过组合各种函数来计算结果.函数式编程与命令式编程最大的不同其实在于,函数式编程关心数据的映射,命令式编程关心解决问 ...
IP2188中文资料书
IP2188 是一款集成 12 种.用于 USB 输出端口的快充协议 IC,支持 USB 端口充电协议.支持 11种快充协议,包括 USB TypeC PD2.0/PD3.0/PPS DFP,HVDC ...
pandas模块的使用详解
为什么学习pandas numpy已经可以帮助我们进行数据的处理了,那么学习pandas的目的是什么呢? numpy能够帮助我们处理的是数值型的数据,当然在数据分析中除了数值型的数据还有好多其他类型的 ...
转 jmeter测试手机号码归属地
jmeter测试手机号码归属地 jmeter测试手机号码归属地接口时,HTTP请求有以下两种书写方法: 1.请求和参数一同写在路径中 2.参数单独写在参数列表中请求方法既可以使用GET方法又可以 ...
从零开始学Java （五）条件选择
if switch while do while for break continue 这块对于有语言基础的人来说可以跳过了. 注意有个equals方法. 1 public class Main { ...
LOJ10074架设电话线
USACO 2008 Jan. Silver 在郊区有 N 座通信基站,P 条双向电缆,第 i 条电缆连接基站 Ai 和 Bi.特别地,1 号基站是通信公司的总站,N 号基站位于一座农场中.现在, ...
linux：搭建java web环境
介绍运行java web的环境搭建准备 Linux:Linux 操作系统 Apache Tomcat:Web 应用服务器 JDK:Java 开发工具包 jdk的安装 1.下载链接 2.上传服务 ...
vue项目中基于D3.js实现桑基图功能
前端实现数据可视化的方案有很多种,以前都是使用百度的echarts,使用起来很方便,直接按照特定的数据格式输入,就能实现相应的效果,虽然使用方便,但是缺点就是无法自定义一些事件操作,可自由发挥的功能很 ...
centos7 快速搭建redis集群环境
本文主要是记录一下快速搭建redis集群环境的方式. 环境简介:centos 7 + redis-3.2.4 本次用两个服务6个节点来搭建:192.168.116.120 和 192.168.1 ...

抓取QQ音乐歌单

抓取QQ音乐歌单的更多相关文章

随机推荐

热门专题