Numpy之数据保存与读取

在pandas使用的25个技巧中介绍了几个常用的Pandas的使用技巧，不少技巧在机器学习和深度学习方面很有用处。本文将会介绍Numpy在数据保存和读取方面的内容，这些在机器学习和深度学习方向也大有用处，因为通常我们会采用Numpy和Pandas处理数据，尤其是Pytorch，它和Numpy的结合更为紧密。

我们先介绍Numpy的几个函数：

numpy.savez(file, *args, **kwds)

file:文件名/文件路径

*args:要存储的数组,可以写多个,如果没有给数组指定Key,Numpy将默认从'arr_0','arr_1'的方式命名

numpy.savez_compressed

使用办法和numpy.savez一样，但是保存的文件会有压缩，可以减小文件大小。

numpy.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# ', encoding=None)

保存为txt文件，fname为文件名称，X为numpy中的变量，fmt为保存格式，delimiter为分隔符。

我们的示例Python代码如下：

# -*- coding: utf-8 -*-

# author: Jclian91

# place: Pudong Shanghai

# time: 2020/3/14 15:14

import numpy as np

# 创建1000*1000的矩阵，元素为0-1之间的随机数

matrix = np.random.rand(1000, 1000)

# 使用save_z和save_compressed保存maxtrix

np.savez("rand_matrix", matrix=matrix)

np.savez_compressed("rand_matrix_compressed", matrix=matrix)

# 保存为txt格式

np.savetxt("rand_matrix.txt", matrix, fmt="%.6f", delimiter=",")

需要注意的是，savetxt函数最多只能保存2维矩阵，3维以上就会报错，rand_matrix.txt中的部分内容如下：

我们看一下保存的文件大小：

可以看到，用savez_compressed保存的文件会比savez保存的文件小，这是因为该函数在文件打包时进行了压缩。

接着是读取npz文件中的内容，我们以rand_matrix.npz为例，示例代码如下：

# -*- coding: utf-8 -*-

# author: Jclian91

# place: Pudong Shanghai

# time: 2020/3/14 15:39

import numpy as np

# 读取npz文件

mat = np.load("rand_matrix.npz")["matrix"]

# 输出mat的相关信息

print(mat.shape)

print(mat[:5, :5])

输出内容如下：

(1000, 1000)

[[0.92338524 0.08321306 0.60686435 0.57764367 0.93594528]

 [0.10552397 0.98878422 0.5237701  0.03220633 0.85022735]

 [0.06755187 0.18767634 0.24769326 0.83413499 0.69020446]

 [0.20900975 0.47176702 0.9302718  0.47056681 0.76258641]

 [0.46927451 0.72896195 0.50372099 0.58216099 0.58198673]]

最后，我们将numpy中的矩阵保存为pickle文件，示例代码如下：

# -*- coding: utf-8 -*-

# author: Jclian91

# place: Pudong Shanghai

# time: 2020/3/14 15:45

import numpy as np

import pickle

# 创建1000*1000的矩阵，元素为0-1之间的随机数

matrix = np.random.rand(1000, 1000)

# 保存为pickle文件

with open("rand_matrix.pk", "wb") as f:

    pickle.dump(matrix, f)

生成的文件大小如下：

可以发现生成的pickle文件和numpy中的savez函数保存的文件大小一样。

本次分享到此结束，感谢大家阅读~

Numpy之数据保存与读取的更多相关文章

C# 结构体和List<T>类型数据转Json数据保存和读取
C# 结构体和List<T>类型数据转Json数据保存和读取一.结构体转Json public struct FaceLibrary { public string face_name ...
Java+MySql图片数据保存与读取的具体实例
1.创建表: drop table if exists photo;CREATE TABLE photo ( id INT NOT NULL AUTO_INCREMENT PRIMARY KEY ...
Numpy数组的保存与读取
1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数.默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save(&quo ...
Numpy数组的保存与读取方法
1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数.默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save(&quo ...
Objective-C数据保存和读取
一.NSCoding协议中的Archiving和Unarchiving (1)Archiving一个object,会记录这个对象的所有的properties到filesystem: (2)Unarch ...
C/C++语言之由数字26引起的文件的数据保存与读取调试。
首先在VS2010中遇到的问题是,建立了一个结构体 struct position{ int x; int y; }: 然后用此结构体声明一个数组rout[8]; for(int i=0;i<8 ...
Numpy中数据的常用的保存与读取方法
小书匠深度学习文章目录: 1.保存为二进制文件(.npy/.npz) numpy.save numpy.savez numpy.savez_compressed 2.保存到文本文件 numpy. ...
Python numpy数据的保存和读取
在科学计算的过程中,往往需要保存一些数据,也经常需要把保存的这些数据加载到程序中,在 Matlab 中我们可以用 save 和 lood 函数很方便的实现.类似的在 Python 中,我们可以用 nu ...
Python Numpy中数据的常用的保存与读取方法
在经常性读取大量的数值文件时(比如深度学习训练数据),可以考虑现将数据存储为Numpy格式,然后直接使用Numpy去读取,速度相比为转化前快很多. 下面就常用的保存数据到二进制文件和保存数据到文本文件 ...

随机推荐

F5 BIG-IP LTM负载均衡策略
standard 模式可以很好的防止 DDOS攻击轮询设置是在POOL 中设置按比率设置是在Node节点中设置
JavaScript 简介与语法
一.JavaScript简介 ).head里面 ).body里面 (在body内最为严谨) ).</html>之后 //程序上来要执行的部分 [2]三个常用对话框 alert()警告对话框 ...
va_list、va_start和va_end使用
我们知道va_start,va_arg,va_end是在stdarg.h中被定义成宏的,由于1.硬件平台的不同 2.编译器的不同,所以定义的宏也有所不同. 在ANSI C中,这些宏的定义位于stdar ...
jquery框架概览(二)
(function(window, undefined) { })(window) window对象作为参数传进闭包的好处 JavaScript 全局对象.函数以及变量均自动成为 window 对象的 ...
Integer 中的缓存类 IntegerCache
我们先看一段代码: public class TestAutoBoxing { public static void main(String[] args) { //-128到127之间 Intege ...
Windows10下Linux系统的安装和使用
WSL 以往我都是直接安装VirtualBox,然后再下载Linux系统的ISO镜像,装到VirtualBox里运行. 改用Win10系统后,了解到了WSL(Windows Subsystem for ...
JDK9新特性-改进进程管理 API
Java 9 这个版本对进程管理方面的改进也是相当大的.在为数不多的几次 Java 项目中,有偶尔用到多线程,但对多进程和进程方面的了解还真是太少. 我想,大部分人应该跟我一样,在编程之外知道有进程的 ...
makefile中的变量赋值
在makefile中赋值方式有:'='.':='.'?='和'+='. A = a $(B) B = b all: echo $(A) #运行结果:echo a b a b 这种赋值方式是没有先后顺序 ...
Web服务器的配置与管理
Web服务器的配置与管理(2) 虚拟主机技术在上篇博文中,我们已经利用IIS搭建好了一台Web服务器,并可以成功访问IIS中自带的默认站点,那么我们是否可以在这台服务器中再创建另外一个Web站点?也 ...
Linux Ubuntu 安装SSH服务
1.安装SSH命令:sudo apt-get install openssh-server 2.启动SSH服务命令:/etc/init.d/ssh start 3.停止SSH服务命令:/etc/ini ...

Numpy之数据保存与读取

Numpy之数据保存与读取的更多相关文章

随机推荐

热门专题