python3 爬去QQ音乐

 import requests

 import re

 import json

 import os

 def get_name(singer):

     url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp'

     params = {

         'catZhida': '',

         'w': singer,

     }

     headers = {

         'referer': 'https://y.qq.com/portal/search.html',

         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'

     }

     html = requests.get(url,headers=headers,params=params).text

     content = re.compile('callback\((.*)\)').findall(html)[0]

     content = json.loads(content)

     data = content.get('data')

     song = data.get('song')

     lists = song.get('list')

     name = []

     for list in lists:

         singer = list.get('singer')[0].get('mid')

         name.append(singer)

     name = name[0]

     return name

 def get_html(name,singer):

     url = 'https://c.y.qq.com/v8/fcg-bin/fcg_v8_singer_track_cp.fcg'

     params = {

         'singermid': name,

         'order': 'listen',

         'begin': '',

         'num': '',

     }

     headers = {

         'referer': 'https://y.qq.com/n/yqq/singer/003aQYLo2x8izP.html',

         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'

     }

     html = requests.get(url,headers=headers,params=params).text

     return html

 def get_music(vkey,songname,filename,singer):

     if vkey and songname:

         url3 = 'http://dl.stream.qqmusic.qq.com/' + filename + '?vkey=' + vkey + '&guid=7133372870&uin=0&fromtag=66'

         headers = {

             'referer': 'https://y.qq.com/n/yqq/singer/003aQYLo2x8izP.html',

             'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'

         }

         music = requests.get(url3,headers=headers).content

         dir = singer

         if  not os.path.exists(dir):

             os.mkdir(dir)

         with open(dir+'/'+songname+'.m4a','wb') as f:

             f.write(music)

         print(songname,'__',singer)

 def get_vkey(strMediaMid,songmid,songname,singer):

     if strMediaMid and songmid and songname :

         url2 = 'https://c.y.qq.com/base/fcgi-bin/fcg_music_express_mobile3.fcg'

         params = {

             'g_tk': '',

             'jsonpCallback': 'MusicJsonCallback8571665793949388',

             'loginUin': '',

             'hostUin': '',

             'format': 'json',

             'inCharset': 'utf8',

             'outCharset': 'utf-8',

             'notice': '',

             'platform': 'yqq',

             'needNewCode': '',

             'cid': '',

             'callback': 'MusicJsonCallback8571665793949388',

             'uin': '',

             'songmid': songmid,

             'filename': 'C400'+ strMediaMid + '.m4a',

             'guid': ''

         }

         headers = {

             'referer': 'https://y.qq.com/portal/player.html',

             'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'

         }

         detail_html = requests.get(url2,headers=headers,params=params).text

         vkey_disc = re.compile('MusicJsonCallback8571665793949388\((.*?)\)').findall(detail_html)[0]

         vkey_disc = json.loads(vkey_disc)

         data = vkey_disc['data']

         items = data.get('items')[0]

         vkey = items.get('vkey')

         get_music(vkey,songname,'C400'+ strMediaMid + '.m4a',singer)

 def get_list(detail_html,singer):

     if detail_html:

         lists = re.compile('data\":{\"list\":(.*?),\"singer_id',re.S).findall(detail_html)[0]

         datas = json.loads(lists)

         for data in datas:

             musicData = data.get('musicData')

             strMediaMid = musicData.get('strMediaMid')

             songmid = musicData.get('songmid')

             songname = musicData.get('songname')

             get_vkey(strMediaMid,songmid,songname,singer)

 def main():

     singer = input('请输入您想要下载的歌手：')

     name = get_name(singer)

     detail_html = get_html(name,singer)

     get_list(detail_html,singer)

 if __name__ == '__main__':

     main()

有些地方代码有些冗余，还可以再改进但是费了些功夫终于爬出的效果确实想要快点编辑出来按耐不住小激动这应该就是敲代码的乐趣

当播放一个音乐的时候在Elements中可以看到音乐的链接当然是通过js 和 css 加载过的但是可以用逆向思维进行参数的找寻

http://dl.stream.qqmusic.qq.com/C4000032qfIn1Tzdbq.m4a？vkey=80525033DD719DAB87C0CEC7B4F9F40D8755982D3A495E3BA0810E50A89668A2AFD61C4C19876FD0FB68932DED89B340AE9F4F464D82DC15&guid=7133372870&uin=0&fromtag=66

发现 vkey 是一个很重要的参数所以就先去翻一翻网页查一下vkey在哪

经发现在同播放页面的JS中但是如果想获得vkey 就需要访问这个对应的URL 也要找到相应的参数

标红箭头的是一直在变化而且没有不行的参数

所以将继续往里使劲挖！

目前处于列表页发现参数已经浮现

但发现第一个红箭头是歌手的意思被不知道用了什么样的格式换了一种形式因为后续还想通过段小乱码找到每个歌手所对应的歌曲所以还是找到每个歌手所对应的小乱码比较好

找到了！！！

但是写代码的话要用正向思维来写 Year!

python3 爬去QQ音乐的更多相关文章

python3 爬取qq音乐作者所有单曲并且下载歌曲
1 import requests import re import json import os # 便于存放作者的姓名 zuozhe = [] headers = {'User-Agent': ' ...
Python爬虫实战一之爬取QQ音乐
一.前言前段时间尝试爬取了网易云音乐的歌曲,这次打算爬取QQ音乐的歌曲信息.网易云音乐歌曲列表是通过iframe展示的,可以借助Selenium获取到iframe的页面元素, 而QQ音乐采用的是 ...
爬取QQ音乐(讲解爬虫思路)
一.问题描述: 本次爬取的对象是QQmusic,为自己后面做django音乐网站的开发获取一些资源. 二.问题分析: 由于QQmusic和网易音乐的方式差不多,都是讲歌曲信息放入到播放界面播放,在其他 ...
爬取QQ音乐歌手的歌单
import requests# 引用requests库res_music = requests.get('https://c.y.qq.com/soso/fcgi-bin/client_search ...
python3爬取咪咕音乐榜信息（附源代码）
参照上一篇爬虫小猪短租的思路https://www.cnblogs.com/aby321/p/9946831.html,继续熟悉基础爬虫方法,本次爬取的是咪咕音乐的排名咪咕音乐榜首页http://m ...
爬取qq音乐巅峰榜---内地音乐的榜单
import requestsimport jsonimport sys for i in range(0,10): url = "https://szc.y.qq.com/v8/fcg-b ...
手把手教你使用Python抓取QQ音乐数据（第一弹）
[一.项目目标] 获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 由浅入深,层层递进,非常适合刚入门的同学练手. [二.需要的库] 主要涉及的库有:requests.json ...
手把手教你使用Python抓取QQ音乐数据（第二弹）
[一.项目目标] 通过Python爬取QQ音乐数据(一)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 此次我们在之前的基础上获取QQ音乐指定歌曲的歌词及前15个精 ...
Python Scrapy的QQ音乐爬虫音乐下载、爬取歌曲信息、歌词、精彩评论
QQ音乐爬虫(with scrapy)/QQ Music Spider UPDATE 2019.12.23 已实现对QQ音乐文件的下载,出于版权考虑,不对此部分代码进行公开.此项目仅作为学习交流使用, ...

随机推荐

新手自定义view练习实例之（一）泡泡弹窗
转载请注明出处:http://blog.csdn.net/wingichoy/article/details/50455412 本系列是为新手准备的自定义view练习项目(大牛请无视),相信在学习过程 ...
Which is Better: Forms Servlet or Socket Mode?
URL:http://blogs.oracle.com/stevenChan/2009/06/which_is_better_forms_servlet_or_socket_mode.html Man ...
Leetcode_24_Swap Nodes in Pairs
本文是在学习中的总结,欢迎转载但请注明出处:http://blog.csdn.net/pistolove/article/details/43302355 Given a linked list, s ...
一个很不错的支持Ext JS 4的上传按钮
以前经常使用的swfUpload,自从2010年开始到现在,很久没更新了.而这几年,flash版本已经换了好多个,所以决定抛弃swfupload,使用新找到的上传按钮. 新的上传按钮由harrydel ...
基于GraphCuts图割算法的图像分割----OpenCV代码与实现
转载请注明出处:http://blog.csdn.net/wangyaninglm/article/details/44151213, 来自:shiter编写程序的艺术 1.绪论图切割算法是组合图论 ...
umask函数的用法 - 如何进行权限位的设置
下面程序创建了两个文件,创建foo文件时,umask值为0,创建第二个时,umask值禁止所有组和其他用户的访问权限. 测试结果: 测试结果可以看出更改进程的文件模式掩码并不影响其父进程(常常是she ...
Android实训案例(一)——计算器的运算逻辑
Android实训案例(一)--计算器的运算逻辑应一个朋友的邀请,叫我写一个计算器,开始觉得,就一个计算器嘛,很简单的,但是写着写着发现自己写出来的逻辑真不严谨,于是搜索了一下,看到mk(没有打广告 ...
PS 色调——颜色运算
通过对三个通道定义不同的运算,使图像的色调改变,进而生成不同色彩的图像. clc; clear all; Image=imread('4.jpg'); Image=double(Image); R=I ...
navicat for mysql远程连接ubuntu服务器的mysql数据库
经常玩服务器上的mysql数据库,但是基于linux操作Mysql多有不便,于是就想着使用GUI工具来远程操作mysql数据库.已经不是三次使用navicat-for-mysql了,但是每次连接远程服 ...
高性能缓存系统Memcached在ASP.NET MVC中应用
在Memcached中实体类型未经序列化不能在Memcached中缓存,因此需要对实体类进行处理,才能缓存下来. Memcached是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库 ...

python3 爬去QQ音乐

python3 爬去QQ音乐的更多相关文章

随机推荐

热门专题