python 关于函数递归调用自己

爬取b站博人传

每页短评20个,页数超过1000页,

代码如下

import requests

import json

import csv

def main(start_url):

    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36',}

    res = requests.get(url=start_url,headers=headers).content.decode()

    data = json.loads(res)

    try:

        data = data['result']['list']

    except:

        print('-----------')

    cursor = re.findall('"cursor":"(\d+)",',res)

    for i in data:

        mid = i['author']['mid']

        uname = i['author']['uname']

        content = i['content']

        content= content.strip()

        try:

            last_index_show = i['user_season']['last_index_show']

        except:

            last_index_show = None

        print(mid,uname,content,last_index_show)

        print('------------------------')

        with open('borenzhuan_duanping.csv', 'a', newline='',encoding='utf-8')as f:

            writer = csv.writer(f)

            writer.writerow([mid,uname,content,last_index_show])

    if cursor:

        next_url = 'https://bangumi.bilibili.com/review/web_api/short/list?media_id={}&folded=0&page_size=20&sort=0&sort=0&cursor='.format(id) + cursor[0]

        main(next_url)

    else:

        print('抓取完成')

if __name__ == '__main__':

    zhuye_url = 'https://www.bilibili.com/bangumi/media/md5978/'

    id = re.findall('md(\d+)', zhuye_url)[0]

    start_url = 'https://bangumi.bilibili.com/review/web_api/short/list?media_id={}&folded=0&page_size=20&sort=0&cursor='.format(id)

    main(start_url)

在爬取过程中发现,每当递归到999会发生异常

RecursionError: maximum recursion depth exceeded in comparison

这个函数在递归自身是发生的异常

只需要在程序开头添加

import sys

sys.setrecursionlimit(100000)

防止内存爆炸

python 关于函数递归调用自己的更多相关文章

Python第七天函数函数参数函数里的变量函数返回值多类型传值函数递归调用匿名函数内置函数
Python第七天函数函数参数函数里的变量函数返回值多类型传值函数递归调用匿名函数内置函数目录 Pycharm使用技巧(转载) Python第一天 ...
python之函数递归
函数递归调用在函数内部,可以调用其它函数,如果一个函数在内部调用自身,即是递归调用为防止无限递归类似于死循环,需要如下: 1.必须要有一个明确的返回值: 2.每次进入更深一层递归时,问题规模应该比 ...
day14函数递归调用
day14函数递归调用 1.装饰器叠加 def deco1(func1): def wrapper1(*args,**kwargs): print('=====>wrapper1 ') res1 ...
Python函数递归调用
函数的递归调用: 是函数嵌套调用的一种特殊形式具体是指: 在调用一个函数的过程中又直接或间接地调用到了本身 # 直接调用本身 def func(): print('我是func') func() f ...
python手动设置递归调用深度
python超出递归深度时会出现异常: RuntimeError: maximum recursion depth exceeded python默认的递归深度是很有限的,大概是900当递归深度超过这 ...
(十七)python 3 函数递归
递归函数即自己调用自己,递归中可以函数自身调用自身,但是使用时类似于条件循环一样,要有递归的终止条件优点:使用递归时,常常可以让代码更加简洁缺点:递归会占用比较多的内存,当递归次数比较多时,性能 ...
python生成器，递归调用
生成器什么是生成器:只要在函数体内出现yield关键字,那么再执行函数就不会执行函数代码,会得到一个结果,该结果就是生成器生成器就是迭代器 yield的功能 yield为我们提供了一种自定义迭代器 ...
gcc O2优化选项对内嵌汇编以及函数递归调用的影响
学习和使用c这些年来,很多方面都未深入研究过,就如脱离了IDE后,我可能连编译一个c文件的命令都写不出来. 最近需要在c中内嵌汇编解决问题,参考网上相关的资料写了一段汇编代码,在测试的时候时好时坏,找 ...
python基础-函数递归
函数递归概念:直接或间接地重复调用函数本身,是一种函数嵌套调用的表现形式. 直接调用:在函数内部,直接调用函数本身 def foo(): print("这是foo函数") foo ...

随机推荐

spring boot 测试插件使用及result风格实例1&打包启动
本节主要内容: 1:spring boot 小插件使用 2:构建第一个简单的result风格的实例并访问 3:将项目打成jar包后启动并访问. 一:添加boot devtools插件: 执行完成后,查 ...
解决scoped 下confirm 样式问题
nowcoder-548C-Tachibana Kanade Loves Review
链接:https://ac.nowcoder.com/acm/contest/548/C来源:牛客网时间限制:C/C++ 2秒,其他语言4秒空间限制:C/C++ 524288K,其他语言10485 ...
让一个div拖动和让一个panel拖动加拉大拉小
一.让一个div拖动 <!doctype html> <html xmlns="http://www.w3.org/1999/xhtml"> <hea ...
mysql简介/安装以及破解密码等
1.什么是数据库: 数据库即存放数据的仓库,只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的过去人们将数据存放在文件柜里,现在数据量庞大,已经不再适用数据库是长期存放在计算机内.有 ...
webservice入门程序学习中经验总结
***第一步:创建客户端服务 1)创建一个服务接口 2)创建一个实现类实现接口 3)创建一个方法开启服务这三步注意点:::实现类上必须添加@WebService标签 :::发布服务的时候用到的函数是 ...
Linux考试试题
mkdir -p /data/oldboy touch lodboy.txt echo "inet addr:10.0.0.8 Bcast:10.0.0.255 Mask:255.255. ...
stress施压案例分析——cpu、io、mem【命令分析】
stress施压命令分析一.stress --cpu 1 --timeout 600 分析现象?负载为啥这么高?top命令查看用户进程消耗的cpu过高(stress进程消耗的) 分析现象,可以看出 ...
DjangoModels
传智博客的python的笔记数据库配置 ORM简介 MVC框架中包括一个重要的部分,就是ORM,它实现了数据模型与数据库的解耦,即数据模型的设计不需要依赖于特定的数据库,通过简单的配置就可以轻松更换 ...
nodejs日常总结
1.node -v 查看当前node版本 2.npm root -g 查看npm安装路径(还有通过npm安装的vue-cli的路径) 默认: /usr/local/lib/node_modules r ...

python 关于函数递归调用自己

python 关于函数递归调用自己的更多相关文章

随机推荐

热门专题