python数据分析之csv/txt数据的导入和保存

约定：

import numpy as np

import pandas as pd

一、CSV数据的导入和保存

csv数据一般格式为逗号分隔，可在excel中打开展示。

示例 data1.csv：

A,B,C,D

1,2,3,a

4,5,6,b

7,8,9,c

代码示例：

# 当列索引存在时

x = pd.read_csv("data1.csv")

print x

'''

   A  B  C  D

0  1  2  3  a

1  4  5  6  b

2  7  8  9  c

'''

示例data2.csv：

1,2,3,a

4,5,6,b

7,8,9,c

代码示例：

# 当列索引不存在时,默认从0开始索引

x = pd.read_csv('data2.csv', header=None)

print x

'''

   0  1  2  3

0  1  2  3  a

1  4  5  6  b

2  7  8  9  c

'''

# 设置列索引

x = pd.read_csv('data2.csv',names=['A','B','C','D'])

print x

'''

   A  B  C  D

0  1  2  3  a

1  4  5  6  b

2  7  8  9  c

'''

# 将一(多)列的元素作为行(多层次)索引

x = pd.read_csv('data2.csv',names=['A','B','C','D'],index_col='D')

print x

'''

   A  B  C

D

a  1  2  3

b  4  5  6

c  7  8  9

'''

x = pd.read_csv('data2.csv',names=['A','B','C','D'],index_col=['D','C'])

print x

'''

     A  B

D C

a 3  1  2

b 6  4  5

c 9  7  8

'''

示例data3.csv：

A,B,C,D

1,2,3,

NULL,5,6,b

7,nan,Nan,c

代码示例：

# 一般NULL nan 空格 等自动转换为NaN

x = pd.read_csv('data3.csv', na_values=[])

print x

'''

     A    B  C    D

0  1.0  2.0  3  NaN

1  NaN  5.0  6    b

2  7.0  NaN  Nan  c

'''

# 将某个元素值设置为NaN

x = pd.read_csv('data3.csv', na_values=['Nan'])

print x

'''

     A    B    C    D

0  1.0  2.0  3.0  NaN

1  NaN  5.0  6.0    b

2  7.0  NaN  NaN    c

'''

# 在对应列上设置元素为NaN

setNaN = {'C':['Nan'],'D':['b','c']}

x = pd.read_csv("data3.csv",na_values=setNaN)

print x

'''

     A    B    C   D

0  1.0  2.0  3.0 NaN

1  NaN  5.0  6.0 NaN

2  7.0  NaN  NaN NaN

'''

# 保存数据到csv文件

x.to_csv('data3out.csv')

'''

data3out:

,A,B,C,D

0,1.0,2.0,3.0,

1,,5.0,6.0,

2,7.0,,,

'''

# 保存数据到csv文件,设置NaN的表示,去掉行索引，去掉列索引(header)

x.to_csv('data3out.csv',index=False,na_rep='NaN',header=False)

'''

data3out:

1.0,2.0,3.0,NaN

NaN,5.0,6.0,NaN

7.0,NaN,NaN,NaN

'''

x = pd.read_csv("data3out.csv",names=['W','X','Y','Z'])

print x

'''

     W    X    Y   Z

0  1.0  2.0  3.0 NaN

1  NaN  5.0  6.0 NaN

2  7.0  NaN  NaN NaN

'''

二、txt数据的导入

txt文件中的数据通常以多个空格或者逗号等分割开。

示例data4.txt：

    A    B    C

a   1    2    3

b   4    5    6

代码示例：

# 读取数据

x = pd.read_table('data4.txt', sep='\s+') # sep:分隔的正则表达式

print x

'''

   A  B  C

a  1  2  3

b  4  5  6

'''

示例data5.txt：

1.176813    3.167020

-0.566606   5.749003

0.931635    1.589505

-0.036453   2.690988

代码示例：

# 使用numpy读取txt

x = np.loadtxt('data5.txt', delimiter='\t') # 分隔符

print x

'''

[[ 1.176813  3.16702 ]

 [-0.566606  5.749003]

 [ 0.931635  1.589505]

 [-0.036453  2.690988]]

'''

python数据分析之csv/txt数据的导入和保存的更多相关文章

Python数据分析之双色球高频数据统计
Step1:基础数据准备(通过爬虫获取到),以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下 : 备注:想要现成数据的可以给我发邮件哟~ ...
CSV格式数据如何导入SqlServer?
一.使用微软数据库IDE管理软件:Microsoft SQL Server Management Studio 1.标准的CSV文件格式如下: 2.建数据表 3.在需要导入的数据库右键点击“任务”,选 ...
CSV格式数据如何导入MySQL？
经常有客户咨询如何将CSV文件导入到MySQL数据库中,特写此文介绍一种方便.快捷的方法. 我们要使用的辅助工具是著名的MySQL管理软件:Navicat for MySQL 1)我准备了一个字符编码 ...
Python数据分析：大众点评数据进行选址
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:砂糖侠如果你处于想学Python或者正在学习Python,Pyth ...
Python 数据分析 - 索引和选择数据
loc,iloc,ix三者间的区别和联系 loc .loc is primarily label based, but may also be used with a boolean array. 就 ...
Python读取Excel中的数据并导入到MySQL
""" 功能:将Excel数据导入到MySQL数据库 """ import xlrd import MySQLdb # Open the w ...
python数据分析第二版：数据加载，存储和格式
一:读取数据的函数 1.读取csv文件 import numpy as np import pandas as pd data = pd.read_csv("C:\\Users\\Admin ...
Python数据分析之全球人口数据
这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...
Python 数据分析—第七章数据归整：清理、转换、合并、重塑
一.数据库风格的Dataframe合并 import pandas as pd import numpy as np df1 = pd.DataFrame({'1key':['b','b','a',' ...

随机推荐

HDU 4370 0 or 1 (最短路）
[题目链接](http://acm.hdu.edu.cn/showproblem.ph Problem Description Given a n/n matrix Cij (1<=i,j< ...
python初步学习-python模块之 commands
commands 通过 os.popen() 执行 shell 命令,返回两个对象,一个是状态码(Int).另一个为命令输出(str) commands.getoutput(cmd) 返回命令执行输 ...
Dream------Java--ant zip 对压缩文件进行指定位置的修改
ant zip 对压缩文件进行指定位置的修改实现功能: 对2中文件进行修改: 需求: 在XX文件中,从二进制流的200字节位置开始,往后的30位字节数量.插入一个值由于涉及到公司内部,不方便写太多 ...
【codeforces】【比赛题解】#872 CF Round #440 (Div.2)
链接. [A]寻找漂亮数字题意: 给定了两列非零数字.我们说一个数是漂亮的,当它的十进制表达中有至少一个数从数列一中取出,至少有一个数从数列二中取出.最小的漂亮数字是多少? 输入: 第一行两个数\( ...
39 - 同步-异步-IO多路复用
目录 1 同步与异步 2 阻塞与非阻塞 3 什么是IO 3.1 内核态用户态 3.2 IO两个阶段 3.3 IO模型 3.3.1 同步阻塞IO 3.3.2 同步非阻塞IO 3.3.3 IO多路复用 3 ...
Count of Smaller Number before itself
Give you an integer array (index from 0 to n-1, where n is the size of this array, value from 0 to 1 ...
移动端测试=== adb 无线连接手机
无线连接(需要借助 USB 线) 除了可以通过 USB 连接设备与电脑来使用 adb,也可以通过无线连接——虽然连接过程中也有需要使用 USB 的步骤,但是连接成功之后你的设备就可以在一定范围内摆脱 ...
mysql状态查看 QPS/TPS/缓存命中率查看【转】
运行中的mysql状态查看对正在运行的mysql进行监控,其中一个方式就是查看mysql运行状态. (1)QPS(每秒Query量) QPS = Questions(or Queries ...
Python_oldboy_自动化运维之路_全栈考试（五）
1.执行 Python 脚本的两种方式 [root@localhost tmp]# cat a.py #!/usr/bin/python # -*- coding: UTF-8 -*- print & ...
session的本质及如何实现共享？
为什么有session? 首先大家知道,http协议是无状态的,即你连续访问某个网页100次和访问1次对服务器来说是没有区别对待的,因为它记不住你. 那么,在一些场合,确实需要服务器记住当前用户怎么办 ...

python数据分析之csv/txt数据的导入和保存

一、CSV数据的导入和保存

二、txt数据的导入

python数据分析之csv/txt数据的导入和保存的更多相关文章

随机推荐

热门专题