爬虫下载rockchip的规格书

#file-name: pdf_download.py

import os

import requests

from bs4 import BeautifulSoup

def download_file(url, index):

    #local_filename1 = index+"-"+url.split('/')[-1]

    local_filename1 = url.split('/')[-1]

    local_filename = local_filename1.replace('%20','_')

    # NOTE the stream=True parameter

    r = requests.get(url, stream=True)

    with open(local_filename, 'wb') as f:

        for chunk in r.iter_content(chunk_size=1024):

            if chunk: # filter out keep-alive new chunks

                f.write(chunk)

                f.flush()

    return local_filename

root_link="https://rockchip.fr/"

#sub = ["main1", "ampak", "chipspark", "firefly", "geekbox", "marsboard", "radxa", "RK312X TRM", "RK3288 TRM"]

sub = [ "ampak", "chipspark", "firefly", "geekbox", "marsboard", "radxa", "RK312X TRM", "RK3288 TRM"]

for i in sub:

    if(i != "main"):

        r=requests.get(root_link+i)

        if(not os.path.exists(i)):

            directory = i.replace(" ", "_")

            os.mkdir( "./"+directory )

            os.chdir( "./"+directory)

        else:

            continue

    #//else:

    #    r=requests.get(root_link)

    print(root_link+i)

    if r.status_code==200:

        soup=BeautifulSoup(r.text)

        # print(soup.prettify())

        index=1

        for link in soup.find_all('a'):

            new_link=root_link+i+'/'+link.get('href')

            if new_link.endswith(".pdf") or new_link.endswith(".DSN") or new_link.endswith(".apk")  :

                file_path=download_file(new_link,str(index))

                print("downloading:"+new_link+" -> "+file_path)

                index+=1

        print(i+" download finished")

    else:

        print("errors occur.")

        exit()

    if(i != "main"):

        os.chdir( "../")

    #else:

    #   pass

print("all download finished")

爬虫下载rockchip的规格书的更多相关文章

python爬虫下载文件
python爬虫下载文件下载东西和访问网页差不多,这里以下载我以前做的一个安卓小游戏为例地址为:http://hjwachhy.site/game/only_v1.1.1.apk 首先下载到内存 ...
爬虫下载City Scape数据
爬虫下载City Scape数据 CityScape是道路场景的经典数据集,但是如right Img8bit_sequence_trainvaltest达到322G,需要用服务器下载比较方便. 需求场 ...
python3爬虫——下载unsplash美图到本地
最近发现一个网站www.unsplash.com ( 没有广告费哈,纯粹觉得不错 ),网页做得很美观,上面也都是一些免费的摄影照片,觉得很好看,就决定利用蹩脚的技能写个爬虫下载图片. 先随意感受一下这 ...
Python爬虫下载Bilibili番剧弹幕
本文绍如何利用python爬虫下载bilibili番剧弹幕. 准备: python3环境需要安装BeautifulSoup,selenium包 phantomjs 原理: 通过aid下载bilibi ...
利用Python编写网络爬虫下载文章
#coding: utf-8 #title..href... str0='blabla<a title="<论电影的七个元素>——关于我对电影的一些看法以及<后会无期 ...
（Python基础教程之二十二）爬虫下载网页视频(video blob)
Python基础教程在SublimeEditor中配置Python环境 Python代码中添加注释 Python中的变量的使用 Python中的数据类型 Python中的关键字 Python字符串操 ...
Python 应用爬虫下载QQ音乐
Python应用爬虫下载QQ音乐目录: 1.简介怎样实现下载QQ音乐的过程: 2.代码 1.下载QQ音乐的过程首先我们先来到QQ音乐的官网: https://y.qq.com/,在搜索栏上输入一首 ...
Python 应用爬虫下载酷狗音乐
应用爬虫下载酷狗音乐首先我们需要进入到这个界面想要爬取这些歌曲链接,然而这个是一个假的网站,虽然单机右键进行检查能看到这些歌曲的链接,可进行爬取时,却爬取不到这些信息. 这个时候我们就应该换一种思 ...
python实现网络爬虫下载天涯论坛帖子
最近发现天涯论坛是一个挺有意思的网站,有各种乱七八糟的帖子足以填补无聊时候的空虚感,但是相当不爽的一件事就是天涯的分页模式下想连贯的把楼主的内容看完实在是太心酸了,一个999页的帖子,百分之九十都是无 ...
fedora环境安装webkit支持作爬虫下载解析JS
环境: 我使用的fedora19.1-xfce版本,属于redhat系的桌面环境. 1.安装 webkit源码安装webkit失败,这里提供的是yum安装方式. a.查看当前yum库中的webkit资 ...

随机推荐

toastr.js 便捷弹框怎么用？怎么本地化？
〇.简介 toastr.js 是一个非常简洁的弹窗消息插件,主要原因就是其脚本和样式文件较小. 并且可以根据自己的需求,修改样式文件,可以应用在多种不同的场景. https://codeseven.g ...
python进阶之路4基本运算符、格式化输出
内容回顾 PEP8规范代码编写规范及美观 python注释语法平时养成写注释的习惯 1.警号 2.三个单引号 3.三个双引号常量与变量 1.变量语法结构变量名赋值符合数据值 2.底层原理 ...
[cocos2d-x]我发现的内存管理机制的一些问题
之前看过的一些文章中关于内存的管理机制讲的非常好,但是我发现它们在谈到每一帧都会创建一个新的内存池的时候,我发现源码并不是这样: PoolManager* PoolManager::getInstan ...
Spring Cloud服务发现组件Eureka
简介 Netflix Eureka是微服务系统中最常用的服务发现组件之一,非常简单易用.当客户端注册到Eureka后,客户端可以知道彼此的hostname和端口等,这样就可以建立连接,不需要配置. E ...
uniapp如何打包wgt格式
打包 build 首次打包,需要配置AppId 登录dcloud开发者中心点击直达创建应用将生成的AppId配置到项目manifest.json中开始打包打包成功
今天试试NuxtJS
nuxt可以大幅缩短首屏加载时间 Progressive Web App (PWA) Support 渐进式web应用简单说就是让你的web应用表现的就像本地应用一样,可以添加快捷方式打开的时候 ...
如何在WSL下交叉编译openwrt
首先我们需要准备一个大小写敏感的文件夹. 然后拉取代码,并且执行代码的先决条件脚本. 注意,如果过程中某项条件不符,你可能要临时修复. 假如下图的组件判定失败(即出现ok=>fail) 那么你就 ...
typora配置图床
PicGo无法上传图片,报下图错误 Error: Error in repo name 这里我使用图床是gitee 上传之前需要安装插件解决方法: 最后一步:配置typora, 点击验证图片选项,查 ...
XMind 2022软件及2000+最全模板素材大全（ 12.5 亲测有效）
XMind 2022 安装下载教程下载直通车 :立即下载模板素材视频直通车:获取 XMind 安装教程解压文件鼠标右击[XMind2022(64bit)]压缩包(win11系统需先点击&quo ...
解决centos7 yum和wget都不能使用
1.前言因为卸载了centos 7.9.2009 内置自带的python2.7.5,导致yum无法使用,但是又没有安装wget,两者不能相互安装导致死循环 2.安装wget 找到自己对应的系统版本, ...

爬虫下载rockchip的规格书

爬虫下载rockchip的规格书的更多相关文章

随机推荐

热门专题