Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称

爬取CBO中国票房网所有电影片名和演员名字

# -*- coding: utf-8 -*-

# 爬取CBO中国票房网所有电影片名

import json

import requests

import time

with open("moviename.txt", 'a') as fh:

    for pn in range(1,320):

        url = 'http://www.cbooo.cn/Mdata/getMdata_movie?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn)

        print(url)

        time.sleep(2)

        try:

            result = requests.get(url).text

            jresult = json.loads(result)

            movices = jresult.get('pData')

            for movie in movices:

                moviename = movie.get('MovieName')

                print(moviename)

                fh.write(moviename + "\n")

        except:

            print('第'+ str(pn) + '失败！')

# 爬取CBO中国票房网所有演员

import json

import requests

import time

with open("moviestar.txt", 'a') as fh:

    for pn in range(1,2665):

        url = 'http://www.cbooo.cn/Mdata/getMdate_pList?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn)

        print(url)

        time.sleep(2)

        try:

            result = requests.get(url).text

            jresult = json.loads(result)

            movices = jresult.get('pData')

            for movie in movices:

                moviename = movie.get('cnName')

                print(moviename)

                fh.write(moviename + "\n")

        except:

            print('第'+ str(pn) + '失败！')

爬取电视剧名称

# -*- coding: utf-8 -*-

# 爬取所有电视剧名称

# 来源：齐鲁电影网

from bs4 import BeautifulSoup

import urllib

url = "http://www.qilumovie.com/filmclass-txt/9.html"

html = urllib.request.urlopen(url).read()

htmldecode = html.decode("gbk") #重点关注

soup = BeautifulSoup(htmldecode,"lxml")

body = soup.body

maplist = body.find_all("li")

with open("tvplay.txt",'a') as fh:

    for tvl in maplist:

        tv = tvl.a.text

        print(tv)

        fh.write(tv + '\n')

如有错误，还请大侠指教一二！

Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称的更多相关文章

python实战项目 — 爬取中国票房网年度电影信息并保存在csv
import pandas as pd import requests from bs4 import BeautifulSoup import time def spider(url, header ...
票房和口碑称霸国庆档，用 Python 爬取猫眼评论区看看电影《我和我的家乡》到底有多牛
今年的国庆档电影市场的表现还是比较强势的,两名主力<我和我的家乡>和<姜子牙>起到了很好的带头作用. <姜子牙>首日破 2 亿,一举刷新由<哪吒之魔童降世&g ...
Python爬取中国天气网
Python爬取中国天气网基于requests库制作的爬虫. 使用方法:打开终端输入 “python3 weather.py 北京(或你所在的城市)" 程序正常运行需要在同文件夹下加入一个 ...
初识python 之爬虫：爬取中国天气网数据
用到模块: 获取网页并解析:import requests,html5lib from bs4 import BeautifulSoup 使用pyecharts的Bar可视化工具"绘制图表& ...
Python爬虫爬取BT之家找电影资源
一.写在前面最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...
python爬取中国知网部分论文信息
爬取指定主题的论文,并以相关度排序. #!/usr/bin/python3 # -*- coding: utf-8 -*- import requests import linecache impor ...
python爬取中国大学排名
教程来自:[Python网络爬虫与信息提取].MOOC. 北京理工大学目标:爬取最好大学网前50名大学代码如下: import requests from bs4 import Beautiful ...
Python爬取全球是最大的电影数据库网站IMDb数据
在使用 Python 开发爬虫的过程中,requests 和 BeautifulSoup4(别名bs4) 应用的比较广泛,requests主要用于模拟浏览器的客户端请求,以获取服务器端响应,接收到的响 ...
scrapy实例:爬取中国天气网
1.创建项目在你存放项目的目录下,按shift+鼠标右键打开命令行,输入命令创建项目: PS F:\ScrapyProject> scrapy startproject weather # w ...

随机推荐

使用Servlet发布WebService
首先感谢熔岩的文章: http://lavasoft.blog.51cto.com/62575/227988 1.Eclipse安装上tomcat插件,http://www.eclipsetotale ...
mysql/mariadb基于ssl的主从复制
当mysql/mariadb跨越互联网进行复制时别人可以窃取到mysql/mariadb的复制信息, 这些信息是明文的, 因此存在不安全性, 这里通过ssl对复制的信息进行加密 1. 创建证书中心在 ...
linux之间文件传输（之scp）
linux的scp命令 linux 的 scp 命令可以在 linux 之间复制文件和目录: ==================scp 命令==================scp 可以 ...
SpringBoot项目eclipse运行正常maven install打包启动后报错ClassNotFoundException
parent的pom.xml <groupId>cn.licoy</groupId> <artifactId>parent</artifactId> & ...
【java】break outer,continue outer的使用
break默认是结束当前循环,有时我们在使用循环时,想通过内层循环里的语句直接跳出外层循环,java提供了使用break直接跳出外层循环,此时需要在break后通过标签指定外层循环.java中的标签是 ...
sort_area_size，sort_area_retained_size
sort_area_sizeoracle不建议设置sort_area_size参数.除非实例被配置成了共享服务器模式.默认值已经足够满足大多数OLTP系统.如果是OLAP.批任务.创建大的索引,可能需 ...
MySQL经常使用技巧
建表每一个表都有一个id字段,最好为UNSIGNED.如 INT(9) UNSIGNED NOT NULL 在表使用一段时间后,使用PROCEDURE ANALYSE得到建议,如select * f ...
debian 8 解压安装mysql（版本5.7.19）
debian 8 解压安装mysql(版本5.7.19)一.下载根据目标主机的型号官网下载mysql安装包如: mysql-server_5.7.19-1debian8_amd64.deb-bund ...
c#asp.net url 传递中文参数要使用 System.Web.HttpUtility.UrlEncode 而不能使用Server.UrlEncode
最近网站里的参数包括中文的例如: http://www.taiba/Tag%b0%ae%c7%e9.html 已开始使用 Server.UrlEncode来做的,但发现,有一些中文在url重写的是说找 ...
8.翻译:EF基础系列----EF中实体的状态
原文链接:http://www.entityframeworktutorial.net/basics/entity-states.aspx 在实体的生命周期中,EF API维护着每一个实体的状态,对于 ...

Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称

Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称的更多相关文章

随机推荐

热门专题