一.python语句存储

1.with open()语句

 with open(name,mode,encoding) as file：

   file.write()

name：包含文件名称的字符串;
mode：决定了打开文件的模式,只读/写入/追加等;
encoding：表示我们要写入数据的编码，一般为 utf-8 或者 gbk ;
file：表示我们在代码中对文件的命名。

2.w：只写模式，如果没有文件则自动创建

 f.write("{} {} {} {}\n".format(title,price,scrible,pic))

3.例子

1）

 with open('a.txt','wb') as f:

     for tag in soup.find_all('div',class_='service-item-pic'):

         a_url = tag.find('a').get('href')

         f.write(a_url)

         f.write('\n')

2）

 for tag in soup.find_all('div',class_='service-item-pic'):

     with open('3.txt', 'a') as f:             

         a_url = tag.find('a').get('href')

         f.write(a_url)

         f.write('\n')

二.保存图片

1.方法

首先用Beautiful Soup结合正则表达式的方式来提取所有链接：

 links = soup.find_all('img', "origin_image zh-lightbox-thumb",src=re.compile(r'.jpg$'))

提取出所有链接后，使用request.urlretrieve来将所有链接保存到本地

2.例子

 import time

 from urllib import request

 from bs4 import BeautifulSoup

 import re

 url = r'https://www.zhihu.com/question/355015346/answer/892031308'

 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}

 page = request.Request(url, headers=headers)

 page_info = request.urlopen(page).read().decode('utf-8')

 soup = BeautifulSoup(page_info, 'html.parser')

 links = soup.find_all('img', "origin_image zh-lightbox-thumb",src=re.compile(r'.jpg$'))

 local_path = r'C:\Users\Administrator\Desktop'

 for link in links:

     print(link.attrs['src'])

     request.urlretrieve(link.attrs['src'], local_path+r'\%s.jpg' % time.time())

python爬虫：将数据保存到本地的更多相关文章

python 爬虫与数据可视化--python基础知识
摘要:偶然机会接触到python语音,感觉语法简单.功能强大,刚好朋友分享了一个网课<python 爬虫与数据可视化>,于是在工作与闲暇时间学习起来,并做如下课程笔记整理,整体大概分为4个 ...
python 爬虫与数据可视化--数据提取与存储
一.爬虫的定义.爬虫的分类(通用爬虫.聚焦爬虫).爬虫应用场景.爬虫工作原理(最后会发一个完整爬虫代码) 二.http.https的介绍.url的形式.请求方法.响应状态码 url的形式: 请求头: ...
pyhton 从web获取json数据保存到本地然后再读取
从web中获取json数据直接进行处理总认为太慢.主要是从web中获取获取数据的过程有点慢. 所以就在想假设先利用空暇时间把json数据获取并保存到本地,然后再从本地文件里读取和操作.应该就要快非常 ...
Python爬虫股票数据爬取
前一篇提到了与股票数据相关的可能几种数据情况,本篇接着上篇,介绍一下多个网页的数据爬取.目标抓取平安银行(000001)从1989年~2017年的全部财务数据. 数据源分析地址分析 http://m ...
Python爬虫与数据图表的实现
要求: 1. 参考教材实例20,编写Python爬虫程序,获取江西省所有高校的大学排名数据记录,并打印输出. 2. 使用numpy和matplotlib等库分析数据,并绘制南昌大学.华东交通大学.江西 ...
在我的新书里，尝试着用股票案例讲述Python爬虫大数据可视化等知识
我的新书,<基于股票大数据分析的Python入门实战>,预计将于2019年底在清华出版社出版. 如果大家对大数据分析有兴趣,又想学习Python,这本书是一本不错的选择.从知识体系上来看, ...
爱奇艺用券付费VIP电影+python爬虫程序+可视化界面+下载本地
申明:本博客中的工具及源码仅供个人学习使用,请勿用作商业等其他任何违法用途!否则后果自负直接步入正题吧! 工具开发环境:windows10,python3.6 工具界面设计:基于python 自带的 ...
从python爬虫以及数据可视化的角度来为大家呈现“227事件”后，肖战粉丝的数据图
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取t.cn ...
python爬虫之数据的三种解析方式
一.正则解析单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非数字 \w :数字.字母.下划线.中文 \W : 非\ ...

随机推荐

BZOJ2820/LG2257 YY的GCD 莫比乌斯反演
问题描述 BZOJ2820 LG2257 题解求 \(\sum\limits_{i=1}^{n}{\sum\limits_{j=1}^{m}{[gcd(i,j)==p]}}\) ,其中 \(p\)为 ...
[译]Vulkan教程(10)交换链
[译]Vulkan教程(10)交换链 Vulkan does not have the concept of a "default framebuffer", hence it r ...
Python 周刊第 418 期
新闻 PyCon US 2020 开始接受财务赞助! https://pycon.blogspot.com/2019/10/financial-aid-launches-for-pycon-us-20 ...
03-MySQL安装与配置
一.安装MySQL 1.我的是centos8,因此命令为: sudo yum install mysql-server 2.安装完成后查看是否启动 ps aux|grep mysql 3.启动mysq ...
PalletOne调色板跨链的ETH提币实现
实现区块链的跨链,最主要的诉求就是Token的转移,而Token的跨链转移又分为充币和提币2种操作.以PalletOne调色板来说,如果要把ETH跨链到PalletOne上来流转,就是ETH的充币操作 ...
Linux系统：centos7下搭建Rocketmq4.3中间件，配置监控台
本文源码:GitHub·点这里 || GitEE·点这里一.环境搭建环境版本 centos7 jdk1.8 已搭建好 rocketmq4.3 1.下载安装包网址 https://www.apac ...
PHP http_response_code 网络函数
定义和用法 http_response_code - 获取/设置响应的 HTTP 状态码版本支持 PHP4 PHP5 PHP7 不支持支持支持语法 http_response_code ([ ...
Python只读取文本中文字符
#coding=utf-8 import re with open('aaa.txt','r',encoding="utf-8") as f: #data = f.read().d ...
关于Java的多线程Runnable的个人理解（基础，不讲概念）
背景说明: 在学了Java的多线程(继承Thread,Runnable)以后,我出于好奇,就想知道java到底是不是多线程的,不能它说自己是多线程就是多线程,自己想验证一下,于是我就想测试一下,但继承 ...
rdd里的foreach无法对外界产生影响
rdd只能用Map返回结果.里面的操作对外界毫无影响因为rdd是分区进行的,都是各个位置的操作,所以为保证数据没有问题,其中的数据对外界操作没有影响想要有影响,就将rdd.collect()实例化 ...

python爬虫：将数据保存到本地

一.python语句存储

1.with open()语句

2.w：只写模式，如果没有文件则自动创建

3.例子

1）

2）

二.保存图片

1.方法

2.例子

python爬虫：将数据保存到本地的更多相关文章

随机推荐

热门专题