pandas中的数据结构-DataFrame
pandas中的数据结构-DataFrame
DataFrame是什么?
表格型的数据结构

- DataFrame 是一个表格型的数据类型,每列值类型可以不同
- DataFrame 既有行索引、也有列索引
- DataFrame 常用于表达二维数据,但可以表达多维数据
DataFrame创建
从字典创建
>>> import pandas as pd
>>> frame=pd.DataFrame(data)
>>> data={'name':['a','b','c'],'pay':[4000,5000,7000]}
>>> frame=pd.DataFrame(data)
>>> frame
name pay
0 a 4000
1 b 5000
2 c 7000
>>>
从二维ndarray创建
>>> import pandas as pd
>>> import numpy as np
>>> data=np.array([('a',4000),('b',6000),('c',9000)])
>>> frame=pd.DataFrame(data,index=range(1,4),columns=['name','pay'])
>>> frame
name pay
1 a 4000
2 b 6000
3 c 9000
DataFrame操作方法
查看数据集的头和尾
- head( 1 ) # 查看第一行
- tail(3) #
>>> frame
name pay
1 a 4000
2 b 6000
3 c 9000
>>> frame.head(1)
name pay
1 a 4000
>>> frame.tail(3)
name pay
1 a 4000
2 b 6000
3 c 9000
查看索引、列和y numpy 数组
- .index
- columns
- values
- describe()
>>> frame.index
RangeIndex(start=1, stop=4, step=1)
>>> frame.columns
Index(['name', 'pay'], dtype='object')
>>> frames.values
>>> frame.values
array([['a', '4000'],
['b', '6000'],
['c', '9000']], dtype=object)
>>> frame.describe()
name pay
count 3 3
unique 3 3
top b 9000
freq 1 1
修改索引index
>>> frame.index=['x','y','z']
>>> frame
name pay
x a 4000
y b 6000
z c 9000
修改列的标题
>>> frame.columns=['name1','pay2']
>>> frame
name1 pay2
x a 4000
y b 6000
z c 9000
修改特定位置元素
修改某一行
>>> frame.values[0]=['d',2]
>>> frame
name1 pay2
x d 2
y b 6000
z c 9000
修改某一行的值
>>> frame.values[1][1]=9000
>>> frame
name1 pay2
x d 2
y b 9000
z c 9000
选择数据
获取某行数据
>>> frame
name1 pay2
x d 2
y b 9000
z c 9000
>>> frame.loc['x']
name1 d
pay2 2
Name: x, dtype: object
按照列获取数据
>>> frame
name1 pay2
x d 2
y b 9000
z c 9000
>>> frame['name1']
x d
y b
z c
Name: name1, dtype: object
>>> frame.pay
1 4000
2 6000
3 9000
Name: pay, dtype: object
>>>
切片
>>> frame.iloc[:2,1]
1 4000
2 6000
Name: pay, dtype: object
修改
>>> frame['name']='admin'
>>> frame
name pay
1 admin 4000
2 admin 6000
3 admin 9000
删除
>>> frame
name pay
1 admin 4000
2 admin 6000
3 admin 9000
>>> del frame['name']
>>> frame
pay
1 4000
2 6000
3 9000
排序
对下标排序
sort_index () 在 指定轴上根据 索引 进行排序,默认升序
>>> b=pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'])
>>> b
0 1 2 3
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
>>> b.sort_index(ascending=False)#行坐标降序
0 1 2 3
c 8 9 10 11
b 4 5 6 7
a 0 1 2 3
>>> b
0 1 2 3
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
>>> b.sort_index(axis=1,ascending=False)#列坐标降序
3 2 1 0
a 3 2 1 0
b 7 6 5 4
c 11 10 9 8
对于值排序
>>> c=b.sort_values(2,ascending=False)
>>> c
0 1 2 3
c 8 9 10 11
b 4 5 6 7
a 0 1 2 3
>>> c=b.sort_values('a',axis=1,ascending=False)#按照axis=1
>>> c
3 2 1 0
a 3 2 1 0
b 7 6 5 4
c 11 10 9 8
表格运算
>>> a=pd.DataFrame(np.arange(12).reshape(3,4))
>>> b=pd.DataFrame(np.arange(12).reshape(3,4))
>>> a
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
>>> b
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
>>> a.add(b)
0 1 2 3
0 0 2 4 6
1 8 10 12 14
2 16 18 20 22
>>> a.sub(b)
0 1 2 3
0 0 0 0 0
1 0 0 0 0
2 0 0 0 0
>>> a.mul(b)
0 1 2 3
0 0 1 4 9
1 16 25 36 49
2 64 81 100 121
>>> a.div(b)
0 1 2 3
0 NaN 1.0 1.0 1.0
1 1.0 1.0 1.0 1.0
2 1.0 1.0 1.0 1.0
比较运算
- 比较运算只能比较相同索引的元素,不进行 补齐
- 采用 > < >= <= == != 等符号进行的二元运算产生
布尔对象
pandas中的数据结构-DataFrame的更多相关文章
- Python之Pandas中Series、DataFrame
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
- Python之Pandas中Series、DataFrame实践
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
- Pandas中Series和DataFrame的索引
在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引.比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字. ...
- [Python] Pandas 中 Series 和 DataFrame 的用法笔记
目录 1. Series对象 自定义元素的行标签 使用Series对象定义基于字典创建数据结构 2. DataFrame对象 自定义行标签和列标签 使用DataFrame对象可以基于字典创建数据结构 ...
- Pandas中Series与Dataframe的区别
1. Series Series通俗来讲就是一维数组,索引(index)为每个元素的下标,值(value)为下标对应的值 例如: arr = ['Tom', 'Nancy', 'Jack', 'Ton ...
- pandas中series和dataframe之间的区别
series结构有索引,和列名组成,如果没有,那么程序会自动赋名为None series的索引名具有唯一性,索引可以数字和字符,系统会自动将他们转化为一个类型object. dataframe由索引和 ...
- pandas中数据框DataFrame获取每一列最大值或最小值
1.python中数据框求每列的最大值和最小值 df.min() df.max()
- Pandas中Series与Dataframe的初始化
(一)Series初始化 1.通过列表,index自动生成 se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony']) print(se) 2.通过列表,指定in ...
- Pandas 数据结构Dataframe:基本概念及创建
"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符串.布尔值等. Dataframe中的数据以一个或多个二维块存放,不是列表.字 ...
随机推荐
- 10、堆叠窗口StackedWidget
新建项目,基类选择QMainWindow,勾选ui 堆叠窗口有三个page,每个page有个label button处,快捷菜单,转到槽,添加代码 void MainWindow::on_push ...
- C语言 - strcat和strncat的编程实现及总结
一.函数strcat与stcncat的函数实现 1.strcat函数的实现 要求: 原型:char * strcat(char *dest, const char *src); 头文件:#inc ...
- 【杂题】[CodeForces 1172D] Nauuo and Portals【构造】
Description 有一个n*n的网格,你需要在上面设置一些传送门,传送门由两个配对的格子组成,从一个进入会立刻从另一个同一方向出来. 现在有n个人从第1列出发向右走,位于(i,1)的人要走到(r ...
- 八、定制new和delete
条款49:了解new-handler的行为 new异常会发生什么事? 在旧式的编译器中,operator new分配内存失败的时候,会返回一个null指针.而现在则是会抛出一个异常. 而在抛出这个异常 ...
- Python3学习笔记(十二):闭包
闭包定义: 在一个外函数中定义了一个内函数,内函数里引用了外函数的临时变量,并且外函数的返回值是内函数的引用.这样就构成了一个闭包. 我们先来看一个简单的函数: def outer(a): b = 1 ...
- CodeForces - 28C Bath Queue 概率与期望
我概率期望真是垃圾--,这题搞了两个钟头-- 题意 有\(n\)个人,\(m\)个浴室,每个浴室里有\(a_i\)个浴缸.每个人会等概率随机选择一个浴室,然后每个浴室中尽量平分到每个浴缸.问期望最长排 ...
- Android学习_7/23
1. 在活动中使用Menu 1) 什么是Menu? 2) 怎么实现? step1:res目录下创建Menu resource file,使用<item… ...
- 「CF 961G」Partitions
题目链接 戳我 \(Solution\) 首先,这个直接推式子.自己推去 所以我们来想一想一些巧妙的方法 \(|S|\sum w_i\) 可以转化为:划分好集合后,每个点都对当前点有\(w_i\)的贡 ...
- 互联网_http协议
一.定义 http协议叫做超文本传输协议,是从web服务器传输超文本到本地浏览器的协议. 二.特征 1.无连接:即每次连接仅处理一个请求,服务器处理完客户的请求,并收到客户端的响应后,即断开连接.采用 ...
- 并发编程--Concurrent-工具类介绍
并发编程--Concurrent-工具类介绍 并发编程--Concurrent-工具类介绍 CountDownLatch CylicBarrier Semaphore Condition 对象监视器下 ...