Numpy 与 DataFrame对比与应用
(一)对比Numpty 与 DataFrame默认索引取值不同点
Numpy索引取值
#Numpy索引取值
data=np.empty((2,4),dtype=int)
print(data)
''' [[4128860 6029375 3801157 7340124]
[7602297 7274600 3342446 54]] ''' #取行
print('取第一行结果')
print(data[0]) #[4128860 6029375 3801157 7340124] 默认data【0】拿到的是数组第一行的值
'''
取第一行结果
[4128860 6029375 3801157 7340124] ''' #取列
print('取第一列的结果')
print(data[:,[0]])
'''
取第一列的结果
[[4128860]
[7602297]]
'''
DataFrame索引取值
#Dataframe的索引取值
data=pd.DataFrame(data)
print(data) '''原始DataFrame数组 0 1 2 3
0 4128860 6029375 3801157 7340124
1 7602297 7274600 3342446 54 ''' #取行的值
print('取第二行的值')
print(data[1:2])
'''
取第一行的值
0 1 2 3
0 4128860 6029375 3801157 7340124
''' #取列的值
print('取第一列的值')
print(data[0]) #这里data【0】拿到的是第一列的值
'''
取第一列的值
0 4128860
1 7602297
Name: 0, dtype: int32 '''
(二)Numpy与DataFrame之间转换
Numpy数组:
通过Numpy生成一个随机5行5列数组
import random
data=np.zeros((5,5),dtype=int)
通过random模块改变数组中的每个值
for i in range(len(data)):
for j in range(len(data[0])):
data[i][j] = random.randint(0,5) print(data) '''Numpy初始的数组结构 [[1 4 4 0 2]
[3 2 5 5 2]
[3 4 1 5 5]
[2 3 1 0 1]
[4 4 1 1 1]] '''
查看Numpy数组类型
#看Numpy初始的数组类型
print(type(data)) #<class 'numpy.ndarray'>
将Numpy数组转为DataFrame数组:
data_new=pd.DataFrame(data)
print(data_new) '''转换为DataFrame之后的结构
0 1 2 3 4
0 1 4 4 0 2
1 3 2 5 5 2
2 3 4 1 5 5
3 2 3 1 0 1
4 4 4 1 1 1 '''
查看转换后的数组类型
#看装换之后的数据类型
print(type(data_new)) #<class 'pandas.core.frame.DataFrame'>
Numpy 与 DataFrame对比与应用的更多相关文章
- Spark与Pandas中DataFrame对比
Pandas Spark 工作方式 单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈 分布式并行计算框架,内建并行机制paral ...
- Spark与Pandas中DataFrame对比(详细)
Pandas Spark 工作方式 单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈 分布式并行计算框架,内建并行机制paral ...
- Scipy和Numpy的插值对比
技术背景 插值法在图像处理和信号处理.科学计算等领域中是非常常用的一项技术.不同的插值函数,可以根据给定的数据点构造出来一系列的分段函数.这一点有别于函数拟合,函数拟合一般是指用一个给定形式的连续函数 ...
- 利用pandas进行数据分析之二:DataFrame与Series数据结构对比
Series与DataFrame对比学习 文章为本人原创,未经同意请勿转载,http://www.cnblogs.com/smallcrystal/ Series:构建的方法,一组数组(列表或元组), ...
- dataframe,list,numpy之间的互相转换
dataframe,numpy,list之间的互相转换 由于目前学校要做一些数据分析处理的作业有要用到dataframe,list,numpy之间的转化,所以在此总结一下这些用法. dataframe ...
- Pandas 之 Series / DataFrame 初识
import numpy as np import pandas as pd Pandas will be a major tool of interest throughout(贯穿) much o ...
- python numpy笔记:给matlab使用者
利用Numpy,python可以进行有效的科学计算.本文给过去常用matlab,现在正学习Numpy的人. 在进行矩阵运算等操作时,使用array还是matrix?? 简短的回答,更多的时候使用arr ...
- Spark核心类:SQLContext和DataFrame
http://blog.csdn.net/pipisorry/article/details/53320669 pyspark.sql.SQLContext Main entry point for ...
- PySpark的DataFrame处理方法
转:https://blog.csdn.net/weimingyu945/article/details/77981884 感谢! ---------------------------------- ...
随机推荐
- Spring MVC的一些学习笔记-入门配置和HttpMessageConverter
1.初步配置 [1]. 配置web.xml以及在web.xml中配置DispatcherServlet: <context-param> <param-name>context ...
- 谈谈JDK8中的字符串拼接
字符串拼接问题应该是每个Java程序员都熟知的事情了,几乎每个Java程序员都读过关于StringBuffer/StringBuilder来拼接字符串. 在大多数的教程中,也许你会看到用+号拼接字符串 ...
- Django 单元测试
mock 测试 mock 是辅助单元测试的模块,用于测试不方便调用的别人的接口.举个简单的例子,比如说,我们测试django 写的微信登录接口,正常流程下,我们需要前端拉起授权窗口,获取jscode或 ...
- 在Linux文件清空的几种方法
在Linux文件清空的几种方法 1.使用重定向的方法 [root@centos7 ~]# du -h test.txt 4.0K test.txt [root@centos7 ~]# > tes ...
- Python的静态方法和类方法
Python中使用@staticmethod这个装饰器让方法变为静态方法 一:定义 @staticmethod: 首先它是一个装饰器,被装饰的方法不需要隐含的参数,对象和对象的实例都可以调用静态方法 ...
- 【学时总结】◆学时·VI◆ SPLAY伸展树
◆学时·VI◆ SPLAY伸展树 平衡树之多,学之不尽也…… ◇算法概述 二叉排序树的一种,自动平衡,由 Tarjan 提出并实现.得名于特有的 Splay 操作. Splay操作:将节点u通过单旋. ...
- 搭建Maven私有仓库
Nexus官网下载:Nexus Repository Manager OSS :https://www.sonatype.com/download-oss-sonatype 1.解压 $ tar -z ...
- 【PHP】Maximum execution time of 30 seconds exceeded解决办法
Maximum execution time of 30 seconds exceeded,今天把这个错误的解决方案总结一下: 简单总结一下解决办法: 报错一:内存超限,具体报错语句忘了,简单说一下解 ...
- 虚拟机桥接模式下多台Ubuntu16.04系统互相连接
1.首先新建一个虚拟机并在该虚拟机上安装Ubuntu16.04系统.为这台虚拟机起名为Ubuntu3. 2.对Ubuntu3进行克隆,为新克隆生成的虚拟机起名为Ubuntu2.(这时我们会发现Ubun ...
- python中的字符串内置方法小结
#!/usr/local/bin/python3 # -*- coding:utf-8 -*- ''' name="my wife is mahongyan" ---------- ...