使用Python实现搜索任意电影资源的磁力链接

对于喜欢电影的人来说各种电影资源必不可少，但每次自己搜索都比较麻烦，索性用python自己写一个自动搜索的脚本。

这里我只分享我的思路，具体如何实现参考代码，要想实现搜索功能先要抓包分析如何发送数据，这里我用的是burp，

这是电影网站搜索框，

输入电影名抓取数据报：

数据一get方式提交，并且进行了url编码，%E9%BB%91%E8%B1%B9进行url解码后正是“黑豹”两个字

python中用于处理url编码的是urllib中的quote模块

name=黑豹

uname=quote(name)
所以我们提交数据的地址为：url='http://www.btbtdy.com/search/'+uname+'.html'

之后就得到这个界面:


我们只需要拿到最顶端的那个连接就行，直接用beautifulsoup进行匹配也可以用re正则匹配，找到“黑豹"两个字的herf属性即可
最后得到的数据为”/btdy/dy7706.html",与原网址进行拼接记得到我们要找电影资源的主页面为：
http://www.btbtdy.com/btdy/dy7706.html
到达主页面后，如果你直接用以前的办法直接用正则或其他的办法去匹配磁力链接的话是不行的，因为这是一个动态的页面，
思路依旧是抓包分析，可以看出主页面提交后有提交多个其他的请求，其中有也个请求是这样的:

在网页上访问后是这样的:

这才是我们要找的网页，只有在这个网页上才能找到真正的资源

上代码：（代码还没有进行异常处理）

 1 import requests

 2 from bs4 import BeautifulSoup

 3

 4 from urllib.parse import quote

 5 import time

 6 import re

 7 import threading

 8

 9 head = {

10         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36',

11         'Referer':'http://www.btbtdy.com/'

12     }

13

14 print('-----------------------------')

15 name=input('请输入需要查找的电影:')

16 print('-----------------------------')

17 uname=quote(name)

18

19 def pyhead():

20

21     url='http://www.btbtdy.com/search/'+uname+'.html'

22

23     return url

24

25 def gethtml(url):

26

27     link=url

28     html=requests.get(link,head)

29     time.sleep(5)

30     soup = BeautifulSoup(html.text, "lxml")

31     html = html.content.decode('utf-8')

32     sorry="对不起，没有找到任何记录,"

33     sodiv=soup.find('div',class_="list_so")

34     if sorry in str(sodiv):

35         print("网站没有资源")

36     else:

37         title=soup.find_all('a',class_="so_pic")

38         r=r'href="(.+?)" '

39         title=re.findall(r,str(title[0]))

40         print("网址为：http://www.btbtdy.com"+title[0])

41         return title

42

43 def gethtml2(title):

44     dr=r'btdy/dy(.+?).html'

45     dtit=re.findall(dr,title[0])

46     url2='http://www.btbtdy.com/vidlist/'+dtit[0]+'.html'

47     dhtml=requests.get(url2,head)

48     time.sleep(5)

49     dsoup=BeautifulSoup(dhtml.text,'lxml')

50     return dsoup

51

52 def getdhtml(dsoup):

53     ddiv=dsoup.find_all('div',class_="p_list")

54     for model in ddiv:

55         h="<h2>720p下载地址</h2>"

56         h2="<h2>1080p下载地址</h2>"

57         h3="<h2>下载地址一</h2>"

58         if h in str(model):

59             print("720p:"'\n')

60             r='<a class="d1" href="(.+?)">磁力</a>'

61             dlink=re.findall(r,str(model))

62             for pdlink in dlink:

63                 print(str(pdlink)+'\n')

64         if h2 in str(model):

65             print("1080p:"'\n')

66             r='<a class="d1" href="(.+?)">磁力</a>'

67             dlink=re.findall(r,str(model))

68             for pdlink in dlink:

69                 print(str(pdlink))

70         if h3 in str(model):

71             print("磁力连接:"'\n')

72             r='<a class="d1" href="(.+?)">磁力</a>'

73             dlink=re.findall(r,str(model))

74             for pdlink in dlink:

75                 print(str(pdlink)+'\n')

76

77

78 def start():

79     url=pyhead()

80     title=gethtml(url)

81     dsoup=gethtml2(title)

82     getdhtml(dsoup)

83 if __name__ == '__main__':

84     go=threading.Thread(start())

85     go.start()

使用Python实现搜索任意电影资源的磁力链接的更多相关文章

第11.5节 Python正则表达式搜索任意字符匹配及元字符“.”（点）功能介绍
在re模块中,任意字符匹配使用"."(点)来表示, 在默认模式下,点匹配除了换行的任意字符.如果指定了搜索标记re.DOTALL ,它将匹配包括换行符的任意字符.关于搜索标记的含义 ...
一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接
[一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天小编以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来 ...
nodejs 实现磁力链接资源搜索 BT磁力链接爬虫
项目简介前端站点项目效果预览 http://findcl.com 使用 nodejs 实现磁力链接爬虫磁力链接解析成 torrent种子信息,保存到数据库,利用 Elasticsearch 实现 ...
Python爬虫爬取BT之家找电影资源
一.写在前面最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...
Python爬虫 -- 抓取电影天堂8分以上电影
看了几天的python语法,还是应该写个东西练练手.刚好假期里面看电影,找不到很好的影片,于是有个想法,何不搞个爬虫把电影天堂里面8分以上的电影爬出来.做完花了两三个小时,撸了这么一个程序.反正蛮简单 ...
学习Python编程的11个资源
用 Python 写代码并不难,事实上,它一直以来都是被声称为最容易学习的编程语言.如果你正打算学习 web 开发,Python 是一个不错的选择,甚至你想学游戏开发也可以从 Python 开始,因 ...
利用Python爬取豆瓣电影
目标:使用Python爬取豆瓣电影并保存MongoDB数据库中我们先来看一下通过浏览器的方式来筛选某些特定的电影: 我们把URL来复制出来分析分析: https://movie.douban.com ...
找电影资源最强攻略，知道这些你就牛B了！
找电影资源最强攻略,知道这些你就牛B了! 电影工厂 2015-07-01 · 分享点击题目下方环球电影,关注中国顶尖电影微杂志我们也许没有机会去走遍千山万水,却可以通过电影进入各种各样的角色来 ...
学习 Python 编程的 19 个资源（转）
学习 Python 编程的 19 个资源 2018-01-07 数据与算法之美编译:wzhvictor,英文:codecondo segmentfault.com/a/119000000418731 ...

随机推荐

ESP8266 ESP-01制作B站粉丝计数器 | Arduino IDE开发ESP8266 | ESP8266存储读取用户数据
1.实物图 2.原理图 3.Arduino程序在程序中修改自己的B站UID和自己家的WiFi名称及密码即可. /*B站粉丝计数器*/ /******************************* ...
GraphicsLab 之 Atmospheric Scattering (二)
作者:i_dovelemon 日期:2020-11-25 主题:Atmospheric Scattering, Volume Scattering, Rayleigh Scattering, Mie ...
[GIT]获取git最新的tag
背景公司前端项目在Jenkins中打包,每次打包需要将新tag回推到仓库中.但是打包失败后如果不删除tag的话下次打包就会失败,需要手动删除,所以在Jenkinsfile中就需要在打包失败时自动删除 ...
redis 做分布式锁
ok 我们从最基础的一步步来加锁: 1.setNx没有expire,拿锁线程挂掉后,死锁 2.setNx然后exipre分两步做,setNx后redis宕机,或者线程挂掉,死锁 3.SETNX re ...
Vmware无法生成本地连接
打开Vmware使用乌班图结果发现没有办法连接本地连接,那就是注册表出现了问题今天推荐一个好软件然后使用进行清理缓存,重新注册表然后直接点击虚拟机里面的编辑->虚拟网络编辑器->把 ...
docker镜像无法删除 Error：No such image：xxxxxx
前言 docker镜像无法删除,通过 docker images 查看镜像明明存在就是删除不了. 删除提示:Error:No such image:xxxxxxx 具体截图内容如下: 解决方法进入目 ...
java并发编程实战《三》互斥锁（上）
互斥锁(上):解决原子性问题原子性问题的源头是线程切换,操作系统做线程切换是依赖 CPU 中断的,所以禁止 CPU 发生中断就能够禁止线程切换. 在早期单核 CPU 时代,这个方案的确是可行的,而且 ...
PyQt（Python+Qt）学习随笔：QListWidget查找项的findItems方法
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址 QListWidget列表部件的findItems方法用于查找列表部件是否有满足条件的项,调用语法如 ...
公司只提供签名服务，不提供证书文件，如何打包Electron应用
需求稍微正规点的公司,都要为自己开发的软件做代码签名,如下图所示代码签名的主要目的是为了确保软件的来源(这个软件是由谁生产的)和软件的内容不被篡改一个软件公司可能有很多团队,很多开发者,开发不同 ...
WPF中Logical Tree和Visual Tree的区别
The Logical TreeThe logical tree describes the relations between elements of the user interface. The ...

使用Python实现搜索任意电影资源的磁力链接

使用Python实现搜索任意电影资源的磁力链接的更多相关文章

随机推荐

热门专题