Python爬取猫眼电影排行

import requests

import pyquery

def crawl_page(url: str) -> None:

    headers = {

        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) \

Chrome/72.0.3626.121 Safari/537.36',

    }

    response = requests.get(url, headers=headers)

    parse_page(response.text)

def parse_page(source_code: str) -> None:

    html = pyquery.PyQuery(source_code)

    dd_elements = html('.board-wrapper dd')

    for dd_element in dd_elements.items():

        data = {

            '排名': dd_element.find('i.board-index').text(),

            '电影名': dd_element.find('a.image-link').attr('title'),

            '主演': dd_element.find('p.star').text().split('：')[1],

            '上映时间': dd_element.find('p.releasetime').text().split('：')[1],

            '评分': dd_element.find('p.score').text(),

        }

        print(data)

        save_data(data)

def save_data(data: dict) -> None:

    data = str(data)

    with open('MaoYan.txt', 'a+', encoding='utf8') as f:

        f.write(data+'\n')

    return None

def main():

    for i in range(0, 100, 10):

        url = 'https://maoyan.com/board/4?offset={}'.format(i)

        crawl_page(url)

if __name__ == '__main__':

    main()

Python爬取猫眼电影排行的更多相关文章

爬虫系列（1）-----python爬取猫眼电影top100榜
对于Python初学者来说,爬虫技能是应该是最好入门,也是最能够有让自己有成就感的,今天在整理代码时,整理了一下之前自己学习爬虫的一些代码,今天先上一个简单的例子,手把手教你入门Python爬虫,爬取 ...
python 爬取猫眼电影top100数据
最近有爬虫相关的需求,所以上B站找了个视频(链接在文末)看了一下,做了一个小程序出来,大体上没有修改,只是在最后的存储上,由txt换成了excel. 简要需求:爬虫爬取猫眼电影TOP100榜单数据 ...
Python 爬取猫眼电影最受期待榜
主要爬取猫眼电影最受期待榜的电影排名.图片链接.名称.主演.上映时间. 思路:1.定义一个获取网页源代码的函数: 2.定义一个解析网页源代码的函数: 3.定义一个将解析的数据保存为本地文件的函数: ...
python学习(23)requests库爬取猫眼电影排行信息
本文介绍如何结合前面讲解的基本知识,采用requests,正则表达式,cookies结合起来,做一次实战,抓取猫眼电影排名信息. 用requests写一个基本的爬虫排行信息大致如下图网址链接为ht ...
python爬取猫眼电影top100
最近想研究下python爬虫,于是就找了些练习项目试试手,熟悉一下,猫眼电影可能就是那种最简单的了. 1 看下猫眼电影的top100页面分了10页,url为:https://maoyan.com/b ...
Python爬取猫眼电影100榜并保存到excel表格
首先我们前期要导入的第三方类库有; 通过猫眼电影100榜的源码可以看到很有规律如: 亦或者是: 根据规律我们可以得到非贪婪的正则表达式 """<div class ...
Python爬取猫眼电影《飞驰人生》47858万条评论并对其进行数据分析
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: Yura不说数据说 ,PYuraL PS:如有需要Python学习资 ...
Python 爬取猫眼电影《无名之辈》并对其进行数据分析
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 罗昭成 PS:如有需要Python学习资料的小伙伴可以加点击下方链接 ...
Python使用asyncio+aiohttp异步爬取猫眼电影专业版
asyncio是从pytohn3.4开始添加到标准库中的一个强大的异步并发库,可以很好地解决python中高并发的问题,入门学习可以参考官方文档并发访问能极大的提高爬虫的性能,但是requests访 ...

随机推荐

学python必须知道的30个技巧
收集这些有用的捷径技巧 1. 原地进行交换两个数字我们对赋值的右侧进行一个新的元组,左侧解析(unpack)那个(未被引用的)元组到变量 <a> 和 <b> 赋值完成时,新的 ...
Nginx中配置非英文域名
前两天遇到个配置越南语的域名的情况.域名和ip解析完成后,直接ping域名也不通,还以为是解析问题.研究了半天,nginx配置非英文域名时,需要有其他操作. 非英文域名转换成punycode编码才可以 ...
Java并发指南1：并发基础与Java多线程
本文转载自互联网,侵删什么是并发在过去单CPU时代,单任务在一个时间点只能执行单一程序.之后发展到多任务阶段,计算机能在同一时间点并行执行多任务或多进程.虽然并不是真正意义上的“同一时间点”,而是 ...
pre-fork 分叉软分叉硬分叉前叉实现 pre-fork implementation
https://mp.weixin.qq.com/s/wIDTs2J1ZkLkAEHqQnkYnw 什么是分叉?为何对区块链发展至关重要? Uselink公有链 Uselink公有链 2018-12- ...
react hook的todolist
感觉好长时间没写博客一样,app.js代码 import React from 'react'; import { useState } from 'react'; function App() { ...
Kontln的属性形式Getter和Setter
package loaderman.demo class Person { val name: String get() = "name" var v: Int = 0 var v ...
Build Telemetry for Distributed Services之OpenCensus：C#
OpenCensus Easily collect telemetry like metrics and distributed traces from your services OpenCensu ...
分布式存储——Build up a High Availability Distributed Key-Value Store
原文链接 Preface There are many awesome and powerful distributed NoSQL in the world, like Couchbase, Mon ...
SpringBoot之HandlerInterceptor拦截器的使用 ——（一）
HandlerInterceptor简介拦截器我想大家都并不陌生,最常用的登录拦截.或是权限校验.或是防重复提交.或是根据业务像12306去校验购票时间,总之可以去做很多的事情.我仔细想了想这里我分三 ...
linux简单命令3---帮助命令
1:帮助命令:man 命令: 2:这个帮助用的比较多(还是中文):命令 --help 3:shell帮助 4:详细命令(比man更详细)帮助,用的少,比较麻烦:info

Python爬取猫眼电影排行

Python爬取猫眼电影排行的更多相关文章

随机推荐

热门专题