【python爬虫】爬云音乐我和xxx共同听过的歌曲

闲聊的时候，觉得，想写个爬虫，爬下2个人共同听过的歌曲有哪些，然后一鼓作气，花了一个多小时，写了一个。支持最近一周和所有时间，需要用户没有关闭听歌排行显示

How to start

使用到的工具是Selenium一个web自动化测试工具，提供IDE以及插件多种方式。python下安装

pip install selenium

chromedriver.exe 下载对应Chrome版本的driver.exe，仓库带了一份Chrome version 78的driver.exe

代码不多，60行，我就直接贴代码了。

python main.py



# -*- coding:utf-8 -*-

from enum import Enum

from time import sleep

from selenium import webdriver

import selenium.webdriver.support.ui as ui

import sys

reload(sys)

sys.setdefaultencoding('utf8')

def get_song_rank_list(url, songs_time):

	print("\n-------------Start---------------")

	driver = webdriver.Chrome(

		executable_path='./drv/chromedriver')

	# https://sites.google.com/a/chromium.org/chromedriver/downloads chrome对应版本driver

	driver.get(url)

	driver.switch_to.frame('g_iframe')

	wait = ui.WebDriverWait(driver, 15)

	data = ""

	song_dict = {}

	if wait.until(lambda driver: driver.find_element_by_class_name('g-bd')):

		if songs_time == 1:

			driver.find_element_by_id('rHeader').find_element_by_id('songsall').click()

			sleep(3)

		data += driver.find_element_by_id('rHeader').find_element_by_tag_name('h4').text

		print(data)

		lists = driver.find_element_by_class_name('m-record').find_elements_by_tag_name('li')

		print("Top{}:".format(len(lists)))

		for l in lists:

			name = (l.find_element_by_tag_name('b').text).decode("utf-8")

			singer = (l.find_element_by_class_name('s-fc8').text.replace('-', '')).decode("utf-8")

			times = l.find_element_by_class_name('bg').get_attribute('style')

			song = "{}, {}, {}".format(name, singer, times)

			print(song)

			song_dict[name] = song

	return song_dict

def compare_song(dict1, dict2):

	print("\n--------------------------------")

	print("\n---->Same song between us")

	for name, song in dict1.iteritems():

		if name in dict2:

			print(song)

	print("---->End")

	print("\n--------------------------------")

SONGS_WEEK = 0

SONGS_ALL = 1

if __name__ == '__main__':

	girl = get_song_rank_list("https://music.163.com/#/user/songs/rank?id=288007045", SONGS_ALL)

	boy = get_song_rank_list("https://music.163.com/#/user/songs/rank?id=39661960", SONGS_ALL)

	compare_song(girl, boy)

Console

【python爬虫】爬云音乐我和xxx共同听过的歌曲的更多相关文章

Python爬虫 - 爬取百度html代码前200行
Python爬虫 - 爬取百度html代码前200行 - 改进版, 增加了对字符串的.strip()处理源代码如下: # 改进版, 增加了 .strip()方法的使用 # coding=utf-8 ...
用Python爬虫爬取广州大学教务系统的成绩（内网访问）
用Python爬虫爬取广州大学教务系统的成绩(内网访问) 在进行爬取前,首先要了解: 1.什么是CSS选择器? 每一条css样式定义由两部分组成,形式如下: [code] 选择器{样式} [/code ...
使用Python爬虫爬取网络美女图片
代码地址如下:http://www.demodashi.com/demo/13500.html 准备工作安装python3.6 略安装requests库(用于请求静态页面) pip install ...
Python爬虫|爬取喜马拉雅音频
"GOOD Python爬虫|爬取喜马拉雅音频喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...
python爬虫爬取内容中，-xa0，-u3000的含义
python爬虫爬取内容中,-xa0,-u3000的含义 - CSDN博客 https://blog.csdn.net/aiwuzhi12/article/details/54866310
Python爬虫爬取一篇韩寒新浪博客
网上看到大神对Python爬虫爬到非常多实用的信息,认为非常厉害.突然对想学Python爬虫,尽管自己没学过Python.但在网上找了一些资料看了一下,看到爬取韩寒新浪博客的视频.共三集,第一节讲爬取 ...
Python爬虫爬取全书网小说，程序源码+程序详细分析
Python爬虫爬取全书网小说教程第一步:打开谷歌浏览器,搜索全书网,然后再点击你想下载的小说,进入图一页面后点击F12选择Network,如果没有内容按F5刷新一下点击Network之后出现如下 ...
python爬虫—爬取英文名以及正则表达式的介绍
python爬虫—爬取英文名以及正则表达式的介绍爬取英文名: 一. 爬虫模块详细设计 (1)整体思路对于本次爬取英文名数据的爬虫实现,我的思路是先将A-Z所有英文名的连接爬取出来,保存在一个cs ...
一个简单的python爬虫,爬取知乎
一个简单的python爬虫,爬取知乎主要实现爬取一个收藏夹里所有问题答案下的图片文字信息暂未收录,可自行实现,比图片更简单具体代码里有详细注释,请自行阅读项目源码: # -*- cod ...

随机推荐

centos7服务搭建常用服务配置之一：SSH
目录 1 SSH服务协议 1.1 ssh服务协议说明 1.2 ssh服务工作机制 1.3 ssh加密技术说明 1.3.1 ssh实现安全链接建立,利用要是和锁头 1.3.2 ssh加密算法 1.4 s ...
利用js对象将iframe数据缓存, 实现子页面跳转后, 返回时不丢失之前填写的数据
利用js对象将iframe数据缓存, 实现子页面跳转后, 返回时不丢失之前填写的数据实现描述:将数据存放在js对象中, 然后放在父页面的document对象中, 在页面刷新的时候将父页面的值取出来, ...
剑指offer1: 组类型——二维数组中的查找（给定一个数字，查找是否在该数组中）
1. 思路: 缩小范围 2. 方法: (1)要查找的数字等于数组中的数字,结束查找过程: (2)要查找的数字小于数组中的数字,去除该数字右边的数字,在剩下的数字里查找: (3)要查找的数字大于数组中的 ...
从cbv到fbv：用函数写视图与用类写视图的区别（drf与restful）
FBV 基于函数的视图 (function base views) CBV 基于类的视图 (class base views) 也就是说我们是用函数编写视图~还是类编写视图我们来看下两个的简单实现 u ...
第10章：深入浅出Ansible
1.Ansible介绍 1).Ansible的优点 Ansible是一个简单的自动化引擎,可完成配置管理.引用部署.服务编排以及其他各种IT需求 Ansible是Python开发并实现的开源软件,其依 ...
Python 流程控制与循环体
Python 的创始人为吉多·范罗苏姆(Guido van Rossum).1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承.Py ...
《深入理解 Java 虚拟机》学习 -- 类加载机制
<深入理解 Java 虚拟机>学习 -- 类加载机制 1. 概述虚拟机把描述类的数据从 Class 文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的 J ...
Java多线程（八）：ReentrantReadWriteLock
读写锁ReentrantReadWriteLock概述读写锁ReentrantReadWriteLock,使用它比ReentrantLock效率更高. 读写锁表示两个锁,一个是读操作相关的锁,称为共 ...
CCF - CCSP 2018-01 绝地求生 BFS
BFS从安全地区方向搞一下就好了 1.还是注意每回合清空 2.posx居然开小了,可不能犯这种错误 3.地图用a和节点的dis重名了,建议其他变量禁止用a命名 4.在输入数据之前continue了,这 ...
CodeFirst实体类中，为什么都把ICollection<x>定义成virtual？
主要是用于延迟加载,提高性能用的只有定义成virtual后才可以延迟加载. 延迟加载,默认情况下,延迟加载被支持,如果你希望禁用它,必须显式声明,最好的位置是在 DbContext 的构造器中. p ...

【python爬虫】 爬云音乐我和xxx共同听过的歌曲

How to start

Console

【python爬虫】 爬云音乐我和xxx共同听过的歌曲的更多相关文章

随机推荐

热门专题

【python爬虫】爬云音乐我和xxx共同听过的歌曲

【python爬虫】爬云音乐我和xxx共同听过的歌曲的更多相关文章