Python数据分析基础——读写CSV文件
1.基础python代码:
#!/usr/bin/env python3 # 可以使脚本在不同的操作系统之间具有可移植性 import sys # 导入python的内置sys模块,使得在命令行中向脚本发送附加的输入
# sys模块的argv参数,传递给python脚本的命令行参数列表,也就是我们运行的脚本的输入文件和写入csv格式的输出文件
# 用命令行读取CSV的输入文件和写入CSV格式的输出的文件
# 用命令行输入: python script_name.py "C:\path\to\input_file.csv" "C:\path\to\output_file.csv"
python 告诉计算机使用Python程序来处理其他的命令行参数。Python收集其余参数,放入argv这个列表
列表中的第一个元素argv[0]用作脚本名称,所以argv[0]表示script_name.py
python将argv[1],即第二个命令行参数————"C:\path\to\input_file.csv",即输入文件的路径和文件名赋值给变量,input_file
python将argv[2],即第三个命令行参数————"C:\path\to\output_file.csv",即输入文件的路径和文件名赋值给变量,output_file
input_file = sys.argv[1]
output_file = sys.argv[2] with open(input_file, 'r', newline = '') as filereader: # with语句,使用with语句,将input_file打开为一个文件对象filereader;'r'表示是只读模式
with open(output_file, 'w', newline = '') as filewriter: # with语句,使用with语句,将output_file打开为一个文件对象filewriter;'w'表示可写模式;with语句可以在语句结束时,自动关闭文件对象
header = filereader.readline() # 使用文件对象的readline方法,读取输入文件扥第一行数据,将读入得字符串
header = header.strip() # 使用strip函数去除每行两端的空格、制表符和换行符
header_list = header.split(',') # 使用split函数用逗号,将字符串拆分成一个列
print(header_list)
filewriter.write(','.join(map(str, header_list)) + '\n') # string模块未spring
for row in filereader:
row = row.strip()
row_list = row.split(',')
print(row_list)
filewriter.write(','.join(map(str, row_list)) + '\n')
2.pandas:
#!/usr/bin/env python3 import sys
import pandas as pd input_file = sys.argv[1]
output_file = sys.argv[2]
#``data_frame_数据框是一种存储数据的方式,数据框中保留了“表格”这种数据组织方式;pandas中下嵌套pandas脑,所以要使用数据框,必须导入pandas包
data_frame = pd.read_csv(input_file) print(data_frame) data_frame.to_csv(output_files, pandas_output_csv)
但是,以上代码,当读取数据$1,006,015.00时,会出错,具体错误为:本来应该将数据$1,006,015.00,分割为:$1,006,015.00,现在,结果却为:"$1",“006”,“015.00”
其原因,在于,CSV文件的存储形式,即为,使用逗号“,”分割一列列数据的分隔符,正是逗号“,”例如:Name, Age, $100.00, "Beijing"
所以,读取操作CSV文件时,是利用逗号","来分割各列的数据,但是当现在出现了数据:$2,000,00.00,由于数据中也含逗号,所以导致该数据整体本身被分割成,$2 000 00.00三份数据,
出现错误。
解决方案:使用CSV模块——python内置CSV模块,即被设计用于正确地处理数据值中的嵌入逗号和其他复杂模式的
#!/usr/bin/env python3
import csv
import sys input_file = sys.argv[1]
output_file = sys.argv[2] with open(input_file, 'r', newline = ' ') as csv_in_file:
with open(output_file, 'w', newline = ' ') as csv_out_file:
filereader = csv.reader(csv_in_file, delimiter = ',') # 使用CSV模块中的reader函数,创建了一个文件读取对象filereader,,用于读取输入文件的行
filewriter = csv.writer(csv_out_file, delimiter = ',') # 使用CSV模块中的writer函数,创建了一个文件读取对象filewriter,用于将数据输出文件
参数delimiter是默认分隔符
for row_list in filereader:
print(row_list)
filewriter.writerow(row_list) # 将filewriter对象中的每行列表值,用writerow函数,写入输出文件
Python数据分析基础——读写CSV文件的更多相关文章
- Python数据分析基础——读写CSV文件2
2.2筛选特定的行: 行中的值满足某个条件 行中的值属于某个集合 行中的值匹配于某个模式(即:正则表达式) 2.2.1:行中的值满足于某个条件: 基础python版: #!/usr/bin/env p ...
- python学习之读写csv文件(使用pandas)
简介 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序 ...
- python3读写csv文件
python读取CSV文件 python中有一个读写csv文件的包,直接import csv即可.利用这个python包可以很方便对csv文件进行操作,一些简单的用法如下. 1. 读文件 csv_ ...
- (Python基础教程之十二)Python读写CSV文件
Python基础教程 在SublimeEditor中配置Python环境 Python代码中添加注释 Python中的变量的使用 Python中的数据类型 Python中的关键字 Python字符串操 ...
- 使用Python读写csv文件的三种方法
Python读写csv文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 前言 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是 ...
- python读写csv文件
文章链接:https://www.cnblogs.com/cloud-ken/p/8432999.html Python读写csv文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 前言 逗 ...
- python习题_读写csv格式的文件
1.读写TXT文件 # *_* coding : UTF-8 *_* # 开发人员 : zfy # 开发时间 :2019/7/7 16:26 # 文件名 : lemon_10_file.PY # 开发 ...
- Python数据分析基础PDF
Python数据分析基础(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1ImzS7Sy8TLlTshxcB8RhdA 提取码:6xeu 复制这段内容后打开百度网盘手 ...
- 用opencsv文件读写CSV文件
首先明白csv文件长啥样儿: 用excel打开就变成表格了,看不到细节 推荐用其它简单粗暴一点儿的编辑器,比如Notepad++, csv文件内容如下: csv文件默认用逗号分隔各列. 有了基础的了解 ...
随机推荐
- vue-绑定style、css
class.style的绑定1.在 v-bind 用于 class 和 style 时, Vue.js 专门增强了它.表达式的结果类型除了字符串之外,还可以是对象或数组2.绑定css2.1对象绑定2. ...
- 项目移动后报error LNK1123
VS20101.解决方案窗口 项目|项目属性|配置属性|清单工具|输入和输出|嵌入清单 “是”改为“否”:2.项目|项目属性|配置属性|连接器|清单文件|嵌入清单 “是”改为“否”:3.对于64位的操 ...
- hdu-1166 敌兵布阵---树状数组模板
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1166 题目大意: 维护动态的区间和,单点更新,就是模板题 #include<iostream& ...
- python_65_生成器1
# map()函数 # map()是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回. # 例 ...
- kubernetes-ingress(十)
ingress https://kubernetes.io/docs/concepts/services-networking/ingress/ pod与ingress的关系 •通过label-sel ...
- CUDA直方图实例=CPU+GPU(global)+GPU(shared)
项目打包下载链接 顺便批判下CSDN上传坑爹现象,好多次都是到了95%或者99%就不动了.我……
- 操作文件 -------JavaScrip
本文摘要:http://www.liaoxuefeng.com/ 在HTML表单中,可以上传文件的唯一控件就是<input type="file">. 注意:当一个表单 ...
- C#装箱与拆箱的研究
在对这个问题展开讨论之前,我们不妨先来问这么几个问题,以系统的了解我们今天要探究的主题. 观者也许曾无数次的使用过诸如System.Console类或.NET类库中那些品种繁多的类.那么,我想问的是它 ...
- Linux命令安装vnc服务端与vnc的客户端
第一歩:运行命令 yum install tigervnc-server -y 第二歩:安装telnet 第三歩:运行vncserver,创建桌面 vncserver -kill :1 删除桌面1的 ...
- linux 环境能变量配置
1, 3.配置环境变量 在/etc/profile文件末尾中添加以下环境变量:(我上面的JDK目录是jdk1.6.0_45,所以下面JAVA_HOME中也是这个) export JAVA_HOME=/ ...