python爬虫25 | 爬取下来的数据怎么保存? CSV 了解一下
大家好
我是小帅b
是一个练习时长两年半的练习生
喜欢
唱!
跳!
rap!
篮球!
敲代码!
装逼!
不好意思
我又走错片场了
接下来的几篇文章
小帅b将告诉你
如何将你爬取到的数据保存下来
有文本文件、redis、数据库(MySQL、MangoDB)等的存储方式
今天先说说
CSV
什么是 CSV?
怎么玩?
牛逼么?
那么接下来就是
CSV 是一个文本文件来的
有点像 excel
也就是它是以一定的表格的格式来展示数据的
我们通常会使用逗号(,)来对每一个单元数据进行分割
分隔符不止是逗号
也可以是制表符(tab)、冒号(:)、分号(;)
比如我们要来表示一个表格中的数据
就可以这样
第1列的名称,第2列的名称,第3列的名称
第1行第1格的数据,第1行第2格的数据,第1行第3格的数据
第2行第1格的数据,第2行第2格的数据,第2行第3格的数据
...
这就是 CSV 的格式
有啥好处呢
说 3 点足以
它支持存储比较大量的数据
我们可以非常方便地利用它进行数据的导入或者导出到电子表格或者数据库
所有支持文本文件的输入输出的编程语言(比如我们的 python),都可以直接操作使用 CSV 文件。
恩
了解什么是 CSV 之后
接下来小帅b会告诉你怎么使用 python 去存储数据到 CSV 文件中
代码走起
我们导入 CSV 这个库
通过 csv.DictWriter 获取 writer 对象
然后就可以写入了
具体看下代码
import csv
with open('xiaoshuaib.csv', mode='w') as csv_file:
fieldnames = ['你是谁', '你几岁', '你多高']
writer = csv.DictWriter(csv_file, fieldnames=fieldnames)
writer.writeheader()
writer.writerow({'你是谁': '小帅b', '你几岁': '18岁', '你多高': '18cm'})
writer.writerow({'你是谁': '小帅c', '你几岁': '19岁', '你多高': '17cm'})
writer.writerow({'你是谁': '小帅d', '你几岁': '20岁', '你多高': '16cm'})
我们这里以字典的方式写入数据到 xiaoshuaib.csv 这个文件中
运行之后
可以看到多了一个文件
打开看看
可以看到
我们的数据就被写进来了
说:是高还是长?
再给大家介绍一个库
pandas
它可以更加方便的操作 CSV 文件
我们先安装一下 pandas
pip install pandas
安装完之后
我们用 pandas 来读取一下我们刚存储的 xiaoshuaib.cvs 文件
import pandas
xiaoshuaib = pandas.read_csv('xiaoshuaib.csv')
print(xiaoshuaib)
打印结果是这样的
是不是又方便又好看呢
用 pandas 来存储 CSV 数据也是很简单的
一个方法就搞定
to_csv
import pandas as pd
b = ['小帅b', '小帅c', '小帅d']
c = ['18岁', '19岁', '20岁']
d = ['18cm', '17cm', '16cm']
df = pd.DataFrame({'你是谁' : b, '你几岁' : c, '你多高' : d})
df.to_csv("xsb.csv", index=False, sep=',')
运行一下
ok
以上就是对 CSV 的主要操作
当你把数据爬取下来的时候
可以使用这招试试把数据存储下来
好了
那么我们下篇再见
peace
猜你喜欢
python爬虫24 | 搞事情了,用 Appium 爬取你的微信朋友圈。
python爬虫21 | 对于b站这样的滑动验证码,不好意思,照样自动识别
点个在看啊~~(破音)
python爬虫25 | 爬取下来的数据怎么保存? CSV 了解一下的更多相关文章
- Python爬虫:爬取喜马拉雅音频数据详解
前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...
- Python爬虫之爬取慕课网课程评分
BS是什么? BeautifulSoup是一个基于标签的文本解析工具.可以根据标签提取想要的内容,很适合处理html和xml这类语言文本.如果你希望了解更多关于BS的介绍和用法,请看Beautiful ...
- [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上)
转载自:http://blog.csdn.net/eastmount/article/details/51231852 一. 文章介绍 源码下载地址:http://download.csdn.net/ ...
- from appium import webdriver 使用python爬虫,批量爬取抖音app视频(requests+Fiddler+appium)
使用python爬虫,批量爬取抖音app视频(requests+Fiddler+appium) - 北平吴彦祖 - 博客园 https://www.cnblogs.com/stevenshushu/p ...
- Python:将爬取的网页数据写入Excel文件中
Python:将爬取的网页数据写入Excel文件中 通过网络爬虫爬取信息后,我们一般是将内容存入txt文件或者数据库中,也可以写入Excel文件中,这里介绍关于使用Excel文件保存爬取到的网页数据的 ...
- python爬虫实战---爬取大众点评评论
python爬虫实战—爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经 ...
- Python爬虫之爬取站内所有图片
title date tags layut Python爬虫之爬取站内所有图片 2018-10-07 Python post 目标是 http://www.5442.com/meinv/ 如需在非li ...
- Python爬虫之爬取淘女郎照片示例详解
这篇文章主要介绍了Python爬虫之爬取淘女郎照片示例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 本篇目标 抓取淘宝MM ...
- python爬虫:爬取链家深圳全部二手房的详细信息
1.问题描述: 爬取链家深圳全部二手房的详细信息,并将爬取的数据存储到CSV文件中 2.思路分析: (1)目标网址:https://sz.lianjia.com/ershoufang/ (2)代码结构 ...
随机推荐
- iOS:界面适配(二)--iPhone/iPad适配(关于xib)
本文纯属个人看法,强迫症后遗症 版本:xcode 6.0 + iOS SDK 8.0 讨论范围:控制器的view(创建VC时自带的xib) ------------------------------ ...
- [Codeforces 496E] Distributing Parts
[题目链接] https://codeforces.com/contest/496/problem/E [算法] 按右端点排序 , 每个乐曲优先选取的左端点最大的演奏家 用std :: set维护贪心 ...
- Flask开启多线程、多进程
一.参数 app.run()中可以接受两个参数,分别是threaded和processes,用于开启线程支持和进程支持. 二.参数说明 1.threaded : 多线程支持,默认为False,即不开启 ...
- vue 目录结构介绍
1 初始目录如下: 2 目录结构介绍 bulid:最终帆布的代码存放位置 config:配置目录,包括端口号等 node_modules:npm加载的项目依赖模块 src:z这里是我们要开发的目录,基 ...
- 疫情控制 2012年NOIP全国联赛提高组(二分答案+贪心)
P1084 疫情控制 题目描述 H 国有 n 个城市,这 n 个城市用 n-1 条双向道路相互连通构成一棵树,1 号城市是首都,也是树中的根节点. H 国的首都爆发了一种危害性极高的传染病.当局为了控 ...
- 无线网络发射选址 2014年NOIP全国联赛提高组(二维前缀和)
P2038 无线网络发射器选址 题目描述 随着智能手机的日益普及,人们对无线网的需求日益增大.某城市决定对城市内的公共场所覆盖无线网. 假设该城市的布局为由严格平行的129 条东西向街道和129 条南 ...
- python自动化学习笔记10-数据驱动DDT与yml的应用
在测试工作中,针对某一API接口,或者某一个用户界面的输入框,需要设计大量相关的用例,每一个用例包含实际输入的各种可能的数据.通常的做法是,将测试数据存放到一个数据文件里,然后从数据文件读取,在脚本中 ...
- [转]c 语言中 %d,%lu等区别
转载至:http://blog.sina.com.cn/s/blog_7d94c35c01019f96.html %d 有符号10进制整数 %ld 长整型 %hd短整型 %hu 无符号短整形 %u无符 ...
- PowerDesigner连接Oracle数据库(32位)反向生成物理数据模型
PowerDesigner可以连接Oracle数据库进行反向生成物理数据模型,本文演示操作过程. 环境说明: 1)Windows8.1,Oracle11R2 32位. 2)PowerDesigner1 ...
- WinForm ListBox 控件用法
下面演示如何利用列表控件 ListBox 实现多选与移动选项: using IMS.WinFormClient.UserControls; using System; using System.Col ...