pandas DataFrame(2)-行列索引及值的获取

pandas DataFrame是二维的,所以,它既有列索引,又有行索引

上一篇里只介绍了列索引:

import pandas as pd

df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]})

print df

# 结果:

   A  B

0  0  3

1  1  4

2  2  5

行索引自动生成了 0,1,2

如果要自己指定行索引和列索引,可以使用 index 和 column 参数:

这个数据是5个车站10天内的客流数据:

ridership_df = pd.DataFrame(

    data=[[   0,    0,    2,    5,    0],

          [1478, 3877, 3674, 2328, 2539],

          [1613, 4088, 3991, 6461, 2691],

          [1560, 3392, 3826, 4787, 2613],

          [1608, 4802, 3932, 4477, 2705],

          [1576, 3933, 3909, 4979, 2685],

          [  95,  229,  255,  496,  201],

          [   2,    0,    1,   27,    0],

          [1438, 3785, 3589, 4174, 2215],

          [1342, 4043, 4009, 4665, 3033]],

    index=['05-01-11', '05-02-11', '05-03-11', '05-04-11', '05-05-11',

           '05-06-11', '05-07-11', '05-08-11', '05-09-11', '05-10-11'],

    columns=['R003', 'R004', 'R005', 'R006', 'R007']

)

data 参数为一个numpy二维数组, index 参数为行索引, column 参数为列索引

生成的数据以表格形式显示:

          R003  R004  R005  R006  R007

05-01-11     0     0     2     5     0

05-02-11  1478  3877  3674  2328  2539

05-03-11  1613  4088  3991  6461  2691

05-04-11  1560  3392  3826  4787  2613

05-05-11  1608  4802  3932  4477  2705

05-06-11  1576  3933  3909  4979  2685

05-07-11    95   229   255   496   201

05-08-11     2     0     1    27     0

05-09-11  1438  3785  3589  4174  2215

05-10-11  1342  4043  4009  4665  3033

下面说下如何获取DataFrame里的值:

1.获取某一列: 直接 ['key']

print(ridership_df['R003'])

# 结果:

05-01-11       0

05-02-11    1478

05-03-11    1613

05-04-11    1560

05-05-11    1608

05-06-11    1576

05-07-11      95

05-08-11       2

05-09-11    1438

05-10-11    1342

Name: R003, dtype: int64

2.获取某一行: .loc['key']

print(ridership_df.loc['05-01-11'])

# 或者

print(ridership_df.iloc[0])

# 结果:

R003    0

R004    0

R005    2

R006    5

R007    0

Name: 05-01-11, dtype: int64

3.获取某一行某一列的某个值:

print(ridership_df.loc['05-05-11','R003'])

# 或者

print(ridership_df.iloc[4,0])

# 结果:

1608

4.获取原始的numpy二维数组:

print(ridership_df.values)

# 结果:

[[   0    0    2    5    0]

 [1478 3877 3674 2328 2539]

 [1613 4088 3991 6461 2691]

 [1560 3392 3826 4787 2613]

 [1608 4802 3932 4477 2705]

 [1576 3933 3909 4979 2685]

 [  95  229  255  496  201]

 [   2    0    1   27    0]

 [1438 3785 3589 4174 2215]

 [1342 4043 4009 4665 3033]]

*注意在这过程中,数据格式如果不一致,会发生转换.

一个综合栗子:

从 ridership_df 找出第一天里客流量最多的车站,然后返回这个车站的日平均客流,以及返回所有车站的平均日客流,作为对比:

def mean_riders_for_max_station(ridership):

    max_index = ridership.iloc[0].argmax()

    mean_for_max = ridership[max_index].mean()

    overall_mean = ridership.values.mean()

    return (overall_mean, mean_for_max)

print mean_riders_for_max_station(ridership_df)

# 结果:

(2342.6, 3239.9)

pandas DataFrame(2)-行列索引及值的获取的更多相关文章

【pandas】pandas.DataFrame.rename()---重置索引名称
官方文档 github地址例子: 创建DataFrame ### 导入模块 import numpy as np import pandas as pd import matplotlib.pypl ...
pandas DataFrame(1)
之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法 ...
pandas | 如何在DataFrame中通过索引高效获取数据？
本文始发于个人公众号:TechFlow,原创不易,求个关注今天是pandas数据处理专题的第四篇文章,我们一起来聊聊DataFrame中的索引. 上一篇文章当中我们介绍了DataFrame数据结构当 ...
pandas DataFrame的新增行列，修改、删除、筛选、判断元素以及转置操作
1)指定行索引和列索引标签 index 属性可以指定 DataFrame 结构中的索引数组, columns 属性可以指定包含列名称的行, 而使用 name 属性,通过对一个 DataFrame 实 ...
pandas DataFrame 索引（iloc 与 loc 的区别）
Pandas--ix vs loc vs iloc区别 0. DataFrame DataFrame 的构造主要依赖如下三个参数: data:表格数据: index:行索引: columns:列名: ...
pandas.DataFrame学习系列1——定义及属性
定义: DataFrame是二维的.大小可变的.成分混合的.具有标签化坐标轴(行和列)的表数据结构.基于行和列标签进行计算.可以被看作是为序列对象(Series)提供的类似字典的一个容器,是panda ...
pandas.DataFrame的pivot()和unstack()实现行转列
示例: 有如下表需要进行行转列: 代码如下: # -*- coding:utf-8 -*- import pandas as pd import MySQLdb from warnings impor ...
pandas学习(创建多层索引、数据重塑与轴向旋转)
pandas学习(创建多层索引.数据重塑与轴向旋转) 目录创建多层索引数据重塑与轴向旋转创建多层索引隐式构造 Series 最常见的方法是给DataFrame构造函数的index参数传递两个或 ...
pandas DataFrame(4)-向量化运算
pandas DataFrame进行向量化运算时,是根据行和列的索引值进行计算的,而不是行和列的位置: 1. 行和列索引一致: import pandas as pd df1 = pd.DataFra ...

随机推荐

Java 处理 iphone拍照后图片EXIF属性翻转90度的方法
http://blog.csdn.net/z69183787/article/details/50320821 Java获取照片EXIF信息 http://blog.csdn.net/ghsau/ar ...
《Android进阶之光》--View体系与自定义View
No1: View的滑动 1)layout()方法的 public class CustomView extends View{ private int lastX; private int last ...
python界面Tkinter编程（tkMessageBox对话框使用）
python界面Tkinter编程(tkMessageBox对话框使用) 转载 https://blog.csdn.net/m_buddy/article/details/80105154 1 ...
教程：在 Visual Studio 中开始使用 Flask Web 框架
教程:在 Visual Studio 中开始使用 Flask Web 框架 Flask 是一种轻量级 Web 应用程序 Python 框架,为 URL 路由和页面呈现提供基础知识. Flask 被称为 ...
Java内存管理-JVM内存模型以及JDK7和JDK8内存模型对比总结（三）
勿在流沙住高台,出来混迟早要还的. 做一个积极的人编码.改bug.提升自己我有一个乐园,面向编程,春暖花开! 上一篇分享了JVM及其启动流程,今天介绍一下JVM内部的一些区域,以及具体的区域在运行 ...
SQL server学习（四）T-SQL编程之事务、索引和视图
今天来分享下T-SQL高级编程中的事务.索引.视图,可以和之前的SQL server系列文章结合起来. 一.事务事务(TRANSACTION)是作为单个逻辑工作单元执行的一系列操作,这些操作作为一个 ...
R2 day2
简单写一下吧 emmmm,来晚了1h,没赶上,所以没交.......(捂脸 T1 开始读错题了诶开烤1.2h后发现是个傻逼题.... 排序一下,维护前缀最左,右端点随机数据我跑的比他们都慢... ...
AGC 019F.Yes or No(思路组合)
题目链接 \(Description\) 一共有\(n+m\)道判断题,其中有\(n\)个答案为"YES",\(m\)个为"NO".现在以随机顺序给你这\(n+ ...
潭州课堂25班：Ph201805201 第五课：格式化输出和深浅复制 (课堂笔记)
格式化输出和字符串转义占位符使用示意作用 %s '%s %s' % ('hello', 'world') 表示占位的是str %d '%d %d' % (1, 2) 表示占位的是int %d ' ...
JDBC（7）—DAO
介绍: DAO(Data Access Object):数据访问对象 1.what:访问数据信息的类,包含了对数据的CRUD(create read.update.delete),而不包含业务相关的信 ...

pandas DataFrame(2)-行列索引及值的获取

pandas DataFrame(2)-行列索引及值的获取的更多相关文章

随机推荐

热门专题