Numpy数据存取
Numpy数据存取
numpy提供了便捷的内部文件存取,将数据存为np专用的npy(二进制格式)或npz(压缩打包格式)格式
npy格式以二进制存储数据的,在二进制文件第一行以文本形式保存了数据的元信息(维度,数据类型),可以用二进制工具查看查看内容
npz文件以压缩打包文件存储,可以用压缩软件解压
import numpy as np a = np.array([['张三','李四','王五','赵六'],['','','','','']])
b = a = np.arange(24).reshape((2,3,4)) np.save('x.npy',a) # 存为.npy文件
np.savez("y.npz", ar0 = a, ar1 = b) # 多个数组存入一个.npz压缩包 c = np.load('x.npy') # .npy文件读入数组
c d = np.load("y.npz") # .npz压缩包读入
d["ar0"] # 单独输出数组
CSV文件存取
Comma-Separated Value,逗号分隔值文件
一种数据存储格式
- 广泛支持
- 类表格
- 存储一维或二维数据
- 文本格式
CSV文件:
- 显示:表格状态
- 源文件:换行和逗号分隔行列的格式化文本
Numpy存储CSV文件
将ndarray数组写入CSV文件中
np.savetxt(frame,array,fmt='%.18e',delimiter=None)
- frame 存储文件、字符串或产生器的名字,可以是.gz或.bz2的压缩文件,对大型数据有用,压缩后存储或读取,节省存储资源
- array 存入文件的数组
- fmt 写入文件中每个元素的字符串格式,例如
- %s (ASCII字符)
- %d (整数)
- %.2f(2位小数的浮点数)
- %.18e(科学计数法,常用)
- np各类型元素存储到CSV中都是字符串,字符串显示的格式,默认%.18e,科学计数法,保留18位小数的浮点数形式存储数据,需要根据情况修改
- delimiter 分隔字符串,默认是任何空格,需要改为 逗号
np的savetxt函数并不是专为生成csv文件用的,它可以生成任何带特定分隔字符的文本文件,但csv文件使用广泛,所以我们一般用此函数只生成csv
import numpy as np a = np.arange(100).reshape(5,20)
np.savetxt('a.csv',a,fmt='%d',delimiter=',') #整数
np.savetxt('a.csv',a,fmt='%.1f',delimiter=',') #一位小数的浮点数 b = np.array([['a','b','c','d'],['','','','']])
np.savetxt('b.csv',b,fmt='%s',delimiter=',') #ASCII字符,不能存储非ASCII字符串
csv文件只能存储一维、二维数据,不能存储多维数据
import numpy as np a = np.arange(24).reshape((2,12))
# a = np.arange(24).reshape((2,3,4)) # 存储多维数据出错
a
np.savetxt('y.csv',a,fmt='%d',delimiter=',')
Numpy读取CSV文件
将CSV文件数据读入ndarray数组
np.loadtxt(frame,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
- frame 文件、字符串或产生器,可以是.gz或bz2压缩文件
- dtype 数据类型,可选,csv的字符串以什么数据类型读入数组中,默认np.float 浮点数
- delimiter 分隔字符串,默认是任何空格,改为 逗号
- skiprows 跳过前x行,一般跳过第一行表头
- usecols 读取指定的列,索引,元组类型
- unpack 如果True,读入属性将分别写入不同数组变量,False 读入数据只写入一个数组变量,默认False
import numpy as np b = np.loadtxt('a.csv', delimiter=',') # 默认浮点型
b = np.loadtxt('a.csv', dtype=np.int, delimiter=',') #数据为整型 #b = np.loadtxt('a.txt', dtype=np.str, delimiter=',') #数据为字符串,输出默认带 b,要去掉用下面方式输出:
b = np.loadtxt('a.txt', dtype=bytes, delimiter=',').astype(str)
b = np.loadtxt('a.txt', dtype=bytes, delimiter=',',skiprows=1,usecols=(2,3)).astype(str) #跳过第一行,读入第3、4列 b
Numpy数据存取的更多相关文章
- 数据分析与展示——NumPy数据存取与函数
NumPy库入门 NumPy数据存取和函数 数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值)是一种常见的文件格式,用来存储批量数据. np.savet ...
- Python数据分析与展示(1)-数据分析之表示(2)-NumPy数据存取与函数
NumPy数据存取与函数 数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据. 将数据写入CSV文件 np ...
- Python——NumPy数据存取与函数
1.数据csv文件存贮 1.1 CSV文件写入 CSV (Comma‐Separated Value, 逗号分隔值)CSV是一种常见的文件格式,用来存储批量数据 np.savetxt(frame, a ...
- 第一周——数据分析之表示 —— Numpy 数据存取与函数
数据的CSV文件的存取 CSV文件:CSV (Comma‐Separated Value, 逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据 np.savetxt(frame, array, ...
- 数据分析与展示---Numpy数据存取与函数
简介 一:数据的CSV文件存取(一维或二维) (一)写入文件savetxt (二)读取文件loadtxt 二:多维数据的存取 (一)保存文件tofile (二)读取文件fromfile (三)NumP ...
- Numpy数据存取与函数
数据的CSV文件存取 多维数据的存取 NumPy的随机数函数 NumPy的统计函数 NumPy的梯度函数
- Pandas数据存取
pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA']) Pandas数据存取 Pandas可以存取多种介质类型数据, ...
- JavaScript数据存取的性能问题
JavaScript中四种基本的数据存取位置: 字面量:只代表自身 字符串.数字.布尔值.对象.函数.数组.正则,以及null和undefined 快 本地变量:var定义的 快 数组元素 ...
- Hyperledger中数据存取的实现
简介 本文介绍了在Hyperledger中数据存取的实现. API接口 Hyperledger提供基于key/value的数据存储,其中key是字符串,value则是二进制字节数组,Hyperledg ...
随机推荐
- ML(4.2): R CART
CART模型 :即Classification And Regression Trees.它和一般回归分析类似,是用来对变量进行解释和预测的工具,也是数据挖掘中的一种常用算法.如果因变量是连续数据,相 ...
- MySQL的结构图
MySQL的结构图 为了更好的了解和配置MySQL,就必须先了解一下MySQL的体系结构.如下图所示: ▲MySQL体系架构图 理解MySQL的体系架构对于成功的配置和调试至关重要.以下将对架构图进行 ...
- Hadoop专业解决方案-第1章 大数据和Hadoop生态圈
一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章 大数据和Hadoop生态圈小组已经翻译完成,在此 ...
- 实验二:C基本数据类型及运算
2.1 建议使用double型 #include<stdio.h> int main(){ double x,y,z,s,p,a; scanf("%lf%lf%lf" ...
- Java-Runoob-高级教程-实例-数组:04. Java 实例 – 数组反转
ylbtech-Java-Runoob-高级教程-实例-数组:04. Java 实例 – 数组反转 1.返回顶部 1. Java 实例 - 数组反转 Java 实例 以下实例中我们使用 Collec ...
- CentOS 6.4 添加永久静态路由所有方法汇总(原创)
转摘,原文章地址:http://blog.sina.com.cn/s/blog_828e50020101ern5.html 查看路由的命令route -n CentOS添加永久静态路由 在使用双网卡, ...
- file_get_contents是打工文件或URL获取内容的方法,比其稳定的还有curl_get_contents
相信使用过file_get_contents函数的朋友都知道,当获取的$url访问不了时,会导致页面漫长的等待,甚至还能导致PHP进程占用CPU达100%,因此这个函数就诞生了 分享一个实际在用的函数 ...
- 3D Render
记录最近遇到的问题: 1:崩溃问题 由于高频率获取DC异常导致. void D3D11Texture2D::Copy2Window(void* srcdc, uint32_t left, uint32 ...
- 一点ExtJS开发的感悟
虽然项目一直采用ExtJS作为前端开发,接触到了一些ExtJS 的一些场景界面,自己也尝试封装一些组件,对于开发70%基本可以满足需求.遇到最为麻烦的就是Ext的模版或者直接拼接字符串再进行eval转 ...
- 网络基础知识 tcp
网络基础相关的知识(1)架构a. C / S架构: client客户端和server服务器端 优势: 能充分发挥PC机的性能b. B / S架构: browser浏览器和server服务器 隶属于C ...