python读取与写入csv,txt格式文件

在数据分析中经常需要从csv格式的文件中存取数据以及将数据写书到csv文件中。将csv文件中的数据直接读取为dict类型和DataFrame是非常方便也很省事的一种做法，以下代码以鸢尾花数据为例。

csv文件读取为dict

代码

# -*- coding: utf-8 -*-

import csv

with open('E:/iris.csv') as csvfile:

    reader = csv.DictReader(csvfile, fieldnames=None)   # fieldnames默认为None,如果所读csv文件没有表头，则需要指定

    list_1 = [e for e in reader]  # 每行数据作为一个dict存入链表中

csvfile.close()

print list_1[0]

输出

{'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'}

如果读入的每条数据需要单独处理且数据量较大，推荐逐条处理然后再放入。

list_1 = list()

for e in reader:

  list_1.append(your_func(e)) # your_func为每条数据的处理函数

多条类型为dict的数据写入csv文件

代码

#   数据

data = [

{'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'},

{'Petal.Length': '1.4', 'Sepal.Length': '4.9', 'Petal.Width': '0.2', 'Sepal.Width': '3', 'Species': 'setosa'},

{'Petal.Length': '1.3', 'Sepal.Length': '4.7', 'Petal.Width': '0.2', 'Sepal.Width': '3.2', 'Species': 'setosa'},

{'Petal.Length': '1.5', 'Sepal.Length': '4.6', 'Petal.Width': '0.2', 'Sepal.Width': '3.1', 'Species': 'setosa'}

]

#   表头

header = ['Petal.Length', 'Sepal.Length', 'Petal.Width', 'Sepal.Width', 'Species']

print len(data)

with open('E:/dst.csv', 'wb') as dstfile:   #写入方式选择wb，否则有空行

    writer = csv.DictWriter(dstfile, fieldnames=header)

    writer.writeheader()    #   写入表头

    writer.writerows(data)  # 批量写入

dstfile.close()

上述代码将数据整体写入csv文件，如果数据量较多且想实时查看写入了多少数据可以使用writerows函数。

读取csv文件为DataFrame

代码

# 读取csv文件为DataFrame

import pandas as pd

dframe = pd.DataFrame.from_csv('E:/iris.csv')

也可以稍微曲折点：

import csv

import pandas as pd

with open('E:/iris.csv') as csvfile:

    reader = csv.DictReader(csvfile, fieldnames=None)   # fieldnames默认为None,如果所读csv文件没有表头，则需要指定

    list_1 = [e for e in reader]  # 每行数据作为一个dict存入链表中

csvfile.close()

dfrme = pd.DataFrame.from_records(list_1)

从zip文件中读取指定csv文件为DataFrame

dst.zip文件中包含有dst.csv和其它文件，现在在不解压缩的情况下直接读取dst.csv文件为DataFrame.

import pandas as pd

import zipfile

z_file = zipfile.ZipFile('E:/dst.zip')

dframe = pd.read_csv(z_file.open('dst.csv'))

z_file.close()

print dframe

DataFrame写入csv文件

dfrme.to_csv('E:/dst.csv', index=False) # 不要每行的编号

读取txt文件为DataFrame

import pandas as pd

frame = pd.read_table(path, header=None, index_col=False, delimiter='\t', dtype=str)

frame = pd.read_table(src_path, delimiter='|', header=None, error_bad_lines=False)

src_path:txt文件路径
delimiter:字段分隔符
header:表头
error_bad_lines: 是否忽略无法读取的行(文件中部分行由于认为事物造成读取错误)
dtype:数据读入后的存储类型

python读取与写入csv,txt格式文件的更多相关文章

python读取和写入csv文件
读取csv文件: def readCsv(): rows=[] with file(r'E:\py\py01\Data\system.csv','rb') as f: reads=csv.reader ...
python读取并写入csv文件
在ubuntu下,新建.csv文件的方法是使用LibreOffice来创建一个数据表,然后我们把表格存储为.csv的格式: “Save as”菜单把我们的表格存为一个CSV的文件格式:命名为csvDa ...
Python json数据写入csv json excel文件
一.写入写入csv和json, 可以使用csv这个包写, 我这里没有使用, 并且把写csv和json的写到一起了具体的代码就不解释了 def write_file(file_name, items ...
Java关于读取Excel文件~xlsx xls csv txt 格式文件~持续汇总~
所需的jar百度网盘链接:https://pan.baidu.com/s/146mrCImkZVvi1CJ5KoiEhQ提取码:c329 1 需要导入jar包,缺1不可 dom4j-1.6.1.jar ...
使用jsp读取TXT格式文件
<%@page import="java.io.BufferedReader"%> <%@page import="java.io.FileReader ...
【转】java将excel文件转换成txt格式文件
在实际应用中,我们难免会遇到解析excel文件入库事情,有时候为了方便,需要将excel文件转成txt格式文件.下面代码里面提供对xls.xlsx两种格式的excel文件解析,并写入到一个新的txt文 ...
批量将某一目录下的.py文件改为.txt格式文件
#!/usr/env/python#-*- coding:utf-8 -*-#批量将某一目录下的.py文件改为.txt格式文件import os,os.pathfile_list = os.listd ...
Python读取图片尺寸、图片格式
Python读取图片尺寸.图片格式需要用到PIL模块,使用pip安装Pillow.Pillow是从PIL fork过来的Python 图片库. from PIL import Image im = ...
SQLBulkCopy使用实例--读取Excel写入数据库/将 Excel 文件转成 DataTable
MS SQL Server 提供一个称为 bcp 的流行的命令提示符实用工具,用于将数据从一个表移动到另一个表(表可以在不同服务器上). SqlBulkCopy 类允许编写提供类似功能的托管代码解决方 ...

随机推荐

PostgreSQL在Update时使用Substring函数截取字符串并且加上CASE WHEN THEN条件判断
--更新 UPDATE wp_order_detail SET layout_type = ( SELECT CASE THEN ) ELSE '' END FROM wp_catalog_size ...
h5 的localStorage和sessionStorage存到缓存里面的值是string类型
localStorage永久存在,不手动清除永远存在:sessionStorage 一次会话的浏览器关闭就自动清除 h5 的localStorage和sessionStorage 存到缓存里面的值都是 ...
运行maven install命令时出现错误（BUILD FAILURE）
运行run as—>maven install时出现以下错误: [ERROR] Failed to execute goal org.apache.maven.plugins:maven-com ...
jmeter插件使用说明
jmeter作为一个开源的接口性能测试工具,其本身的小巧和灵活性给了测试人员很大的帮助,但其本身作为一个开源工具,相比于一些商业工具(比如LoadRunner),在功能的全面性上就稍显不足. 这篇博客 ...
Python sqlalchemy orm 外键关联
创建外键关联并通过relationship 互相调用如图: 实现代码: import sqlalchemy # 调用链接数据库 from sqlalchemy import create_engi ...
webpack 几个基本打包扩展项的安装命令
网速比较慢的童鞋,装包时请准备好花生瓜子 webpack 本身只能打包 JavaScript 模块,但是它可以通过拓展打包比如静态资源文件.less.sass.typescript 等,还可以通过 b ...
day01编程语言，计算机组成: 五大组成部分，计算机三大核心，进制，内存分布图，操作系统
本周内容第一天: 计算机原理操作系统第二天: 编程语言 python入门:环境 - 编辑器变量基本数据类型学习方法鸡汤 - 干货wwwh:what | why | where | h ...
20175312 2018-2019-2 《Java程序设计》第5周学习总结
20175312 2018-2019-2 <Java程序设计>第5周学习总结教材学习内容总结已依照蓝墨云班课的要求完成了第六章的学习,主要的学习渠道是PPT,和书的课后习题. 总结如下 ...
【笔记】Cocos2dx学习笔记
自建场景类自建场景类BaseScene继承与Scene类,在init函数中添加了默认的,键盘与鼠标事件的响应,添加了一个用于读取XML文件的字典,添加了一个结束场景的方法. 类的声明代码如下: #i ...
5_bash
bash及其特性:shell:外壳.用户直接接入计算机的时候所使用的外壳程序linux允许一个用户账户登录多次,而这多次登录的每一个打开的shell都是独立的互不相干的shell,它们是三个进程,每一 ...

python读取与写入csv,txt格式文件

python读取与写入csv,txt格式文件

csv文件读取为dict

多条类型为dict的数据写入csv文件

读取csv文件为DataFrame

从zip文件中读取指定csv文件为DataFrame

DataFrame写入csv文件

读取txt文件为DataFrame

python读取与写入csv,txt格式文件的更多相关文章

随机推荐

热门专题