pandas（二）

层级索引：

　　index=[('a',2010),('b',2011),('c',2010'),('a',2012),('e',2010),('f',2011)]

　　age=[18,17,18,16,18,17]

常规创建

　　pop =pd.Series(age,index=index)

MultiIndex创建

　　index= pd.MultiIndex.from_tuples(index)

　　pop = pop.reindex(index) 最原先的索引重置为multiindex

　　pop[:,2010] 取出2010的所有数据

高维数据的多级索引：

　　pop_df = pop.unstack()

　　本质是生成一个a-f为行索引，年份为列索引的矩阵，缺失值用nan

　　pop = pop_df.stack() 和unstack相反

多级索引创建：

　　直接将index参数设为二维

　　df = pd.DataFrame(np.random.rand(4,2),

　　　　　　　　　　　　　　index=[['a','a','c','d'],[1,2,1,1]],

　　　　　　　　　　　　　　columns=['data1','data2'])

　　将元祖作为键的字典传入

　　data = {('a',1):18,('a',2):19,('b',1):20}

　　pd.Series(data)　　

　　显式创建多级索引

　　pd.MultiIndex.from_arrays([['a','a','b','b'],[1,2,1,2]])

　　pd.MultiIndex.from_tuples([('a',1),('a',2),('b',1),('b',2)])　　

多级索引等级名称

　　pop.index.names=['name','year'] 以前面例子来说给name是a一列的名称，year是2010一列的形成

Series多级索引

获取单个元素：

　　pop['a',2010]

　　也可以支持局部取值

　　pop['a']

　　局部切片

　　pop['a':'c'] 但要求muliIndex按顺序排列

　　pop[:,2012]

　　pop[pop>18]

　　pop[['a','b']]

pandas（二）的更多相关文章

python数据分析学习(2)pandas二维工具DataFrame讲解
目录二:pandas数据结构介绍下面继续讲解pandas的第二个工具DataFrame. 二:pandas数据结构介绍 2.DataFarme DataFarme表示的是矩阵的数据表,包含 ...
pandas(二)
1.Series序列一维的数组数据,构建是传二维数据会报错,数据具有索引,构建时如果不传索引,默认为数字rang索引. series存在列名和索引,sr.at[0]是通过列名来定位数据(iat定位行 ...
Python二维数据分析
一.numpy二维数组 1.声明 import numpy as np #每一个[]代表一行 ridership = np.array([ [ 0, 0, 2, 5, 0], [1478, 3877, ...
numpy和pandas简单使用
numpy和pandas简单使用 import numpy as np import pandas as pd 一维数据分析 numpy中使用array, pandas中使用series numpy一 ...
第十章、jupyter入门之pandas
目录第十章.jupyter入门之pandas 一.什么是pandas 二.Series 三.基本概念四.基本运算五.DataFrame 第十章.jupyter入门之pandas 一.什么是pan ...
【Python】如何处理Excel中的数据
我们平时在做自动化测试的时候,可能会涉及到从表格中去读取或者存储数据,我们除了可以使用openpyxl来操作excel,当然也可以利用pandas来完成,这篇随笔只是我在学习过程中的简单记录,其他的功 ...
2. RDD(弹性分布式数据集Resilient Distributed dataset)
*以下内容由<Spark快速大数据分析>整理所得. 读书笔记的第二部分是讲RDD.RDD 其实就是分布式的元素集合.在 Spark 中,对数据的所有操作不外乎创建RDD.转化已有RDD以及 ...
pandas库学习笔记（二）DataFrame入门学习
Pandas基本介绍——DataFrame入门学习前篇文章中,小生初步介绍pandas库中的Series结构的创建与运算,今天小生继续“死磕自己”为大家介绍pandas库的另一种最为常见的数据结构D ...
[数据清洗]- Pandas 清洗“脏”数据（二）
概要了解数据分析数据问题清洗数据整合代码了解数据在处理任何数据之前,我们的第一任务是理解数据以及数据是干什么用的.我们尝试去理解数据的列/行.记录.数据格式.语义错误.缺失的条目以及错误的 ...
Pandas系列（二）- DataFrame数据框
一.初识DataFrame dataFrame 是一个带有索引的二维数据结构,每列可以有自己的名字,并且可以有不同的数据类型.你可以把它想象成一个 excel 表格或者数据库中的一张表DataFram ...

随机推荐

让CPU占用率曲线听你指挥
使用GetTickCount()和Sleep(): Code#include <stdio.h> #include <unistd.h> #include <time.h ...
11、Grafana 5.0 新功能特性（译文）
Grafana v5.0的新功能这是Grafana有史以来最重大的更新. 本文将详细介绍主要的新功能和增强功能. New Dashboard Layout Engine enables a mu ...
末学者笔记--Linux中RAID磁盘阵列及centos7启动过程
<一>RAID概念磁盘阵列(Redundant Arrays of Independent Disks,RAID),有“独立磁盘构成的具有冗余能力的阵列”之意. 磁盘阵列是由很多价格较便 ...
apache基础
apache基于多域名的虚拟主机 NameVirtualHost *:80<VirtualHost *:80> DocumentRoot "/var/www/html/xk/sh ...
codeforces 502 g The Tree
题解: 一道优秀的题目有几种做法: 1.维护后缀和刚开始我想的是维护前缀和然后用$sum[x]-sum[y]>=dep[x]-dep[y]$来做但是这样子树赋值为0这个操作就很难进行了 ...
UOJ#110. 【APIO2015】Bali Sculptures 贪心动态规划
原文链接https://www.cnblogs.com/zhouzhendong/p/UOJ110.html 题解我们发现n=2000 的子任务保证A=1! 分两种情况讨论: $n\leq 100$ ...
用es6方式的写的订阅发布的模式
//发布订阅模式 class EventEmiter { constructor() { //维护一个对象 this._events = { } } on(eventName, callback) { ...
Fragment基础操作
Fragment和Activity类似,同样是具备UI的属性:也就是都能用于规划UI布局... Building a Dynamic UI with Fragments --> Fragment ...
defer 内追踪变量变化
遇到一个需求,需要追踪变量的最终情况.defer比较合适,但是写了变量和指针都无效,于是试了试: 变量,变量地址,指针的使用情况 func TestDefer(t *testing.T) { a := ...
MVC 程序在编译时提示 GAC与 Temporary ASP.NET Files目录内引用文件版本不一致
今天在调试Mvc程序时,提示GAC与Temporary ASP.NET Files目录内引用文件版本不一致. [A]System.Web.WebPages.Razor.Configuration.Ho ...

pandas（二）

pandas（二）的更多相关文章

随机推荐

热门专题