Pandas之Dataframe叠加，排序，统计，重新设置索引

Pandas之Dataframe索引，排序，统计，重新设置索引

一：叠加

import pandas as pd

a_list = [df1,df2,df3]

add_data = pd.concat(a_list,ignore_index = True)

其中的ignore_index参数代表是否重新建立索引。

如果df比较多，可以采用如下方法建立a_list

a_list = []

for i in range(len(df)）:

     a_list.append(df[i])

二：排序

df.sort_values(by=["B","A"] , ascending=(False,False))

df.sort_values(by=["A","B"] , ascending=(False,False))

这两个表达式结果不一样，第一个是先按B排的基础上，当B一样时再按A排，第二个是先按照A排完再按B排。

其中ascending默认是FALSE，即默认会按照相应的by中的第几个元素降序排序，当希望用第几个元素升序排序时，可以设置成TRUE

三：统计

df["A"].value_counts()#对A列进行统计，计数然后生成一个只有一个A值和对应计数值。

这个是统计A列中的唯一值有多少。

如果统计多列的计数值，可以采用如下方法

 a = [["None" for col in range(3)] for row in

 range(len(df["A"]*len(df["B"])

 k = 0

 for i in range(len(df["A"]):

     for j in range(len(df["B"]):

         a[k][0] = df.A[i]

         a[k][1] = df.B[j]

         data_select = df[df.A==x[i]&df.B==x[j]]

         a[k][2] = len(data_select)

df["A"].unique()

这个会直接取出A列中的唯一值

四、重新设置索引

df = df.reset_index(drop = True)

重新设置行索引

Pandas之Dataframe叠加，排序，统计，重新设置索引的更多相关文章

吴裕雄--天生自然python学习笔记：pandas模块DataFrame 数据的修改及排序
import pandas as pd datas = [[65,92,78,83,70], [90,72,76,93,56], [81,85,91,89,77], [79,53,47,94,80]] ...
python 数据处理学习pandas之DataFrame
请原谅没有一次写完,本文是自己学习过程中的记录,完善pandas的学习知识,对于现有网上资料的缺少和利用python进行数据分析这本书部分知识的过时,只好以记录的形势来写这篇文章.最如果后续工作定下来 ...
重拾Python(4):Pandas之DataFrame对象的使用
Pandas有两大数据结构:Series和DataFrame,之前已对Series对象进行了介绍(链接),本文主要对DataFrame对象的常用用法进行总结梳理. 约定: import pandas ...
Pandas之DataFrame——Part 3
''' [课程2.] 数值计算和统计基础常用数学.统计方法 ''' # 基本参数:axis.skipna import numpy as np import pandas as pd df = pd ...
Spark与Pandas中DataFrame对比
Pandas Spark 工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制paral ...
pandas中DataFrame相关
1.创建 1.1 标准格式创建 DataFrame创建方法有很多,常用基本格式是:DataFrame 构造器参数:DataFrame(data=[],index=[],coloumns=[]) In ...
Pandas之DataFrame——Part 1
''' [课程2.] Pandas数据结构Dataframe:基本概念及创建 "二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符 ...
Spark与Pandas中DataFrame对比（详细）
Pandas Spark 工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制paral ...
pandas 学习第7篇：DataFrame - 数据处理（应用、操作索引、重命名、合并）
DataFrame的这些操作和Series很相似,这里简单介绍一下. 一,应用和应用映射 apply()函数对每个轴应用一个函数,applymap()函数对每个元素应用一个函数: DataFrame. ...

随机推荐

日志管理中获取浏览器、操作系统、IP等信息。。。
今天在书写日志管理的模块的时候,遇到了一些问题,首先是日志的添加,就是在登录的时候记下他登录的名字以及登录的时间和登录的一些信息给存入到日志表中,这一下给蒙了,于是就查找资源,在这里我就简单地总结一下 ...
神州数码策略路由（PBR）配置
实验要求:掌握PBR配置的方法拓扑如下 R1 enable 进入特权模式 config 进入全局模式 hostname R1 修改名称 interface s0/1 进入端口 ip address ...
从软件测试转型到C#上位机程序员
一直在做软件测试的工作,天天与程序员不依不饶的争论细节的问题,没想到自己也有那么一天走上程序员的道路,由此开始,我的博客天天更新自己的学习状态,分享自己的心得. C#是微软公司发布的一种面向对象的.运 ...
redis的LRU算法（二）
前文再续,书接上一回.上次讲到redis的LRU算法,文章实在精妙,最近可能有机会用到其中的技巧,顺便将下半部翻译出来,实现的时候参考下. 搏击俱乐部的第一法则:用裸眼观测你的算法 Redis2.8的 ...
python 读fnl数据
(1) FNL 数据介绍 FNL((Final Operational Global Analysis)数据是美国国家环境预报中心(NECP)/美国国家大气研究中心(NCAR)提供的全球再分析资料,空 ...
Java CAS同步机制实践应用
利用CAS实现原子操作类AtomicInteger (这是自定义的AtomicInteger:java有封装好的原子操作AtomicInteger类): class AtomicInteger { p ...
9. Web browser-related （网页浏览器相关 4个）
Firefox NoScript是Firefox的插件,可以阻止JavaScript,Java,Flash和其他插件内容(允许您选择性地重新启用某些站点). 它还提供跨站点脚本保护. 这主要是为了保持 ...
java的接口
接口(英文:Interface),在JAVA编程语言中是一个抽象类型,是抽象方法的集合,接口通常以interface来声明.一个类通过继承接口的方式,从而来继承接口的抽象方法. 接口并不是类,编写接口 ...
JMeter安装时Binarys与Source，tgz与zip如何选择？
在 http://jmeter.apache.org/download_jmeter.cgi 或 http://jmeter.apache.org/ 的 Download 版块下载 JMet ...
Java_04循环结构
1.while 循环结构格式: while(循环条件){ } 关键字 while 后的小括号中的内容是循环条件.循环条件是一个表达式,值为布尔类型. { }大括号中的语句统称为循环操作,又称为循环体 ...

Pandas之Dataframe叠加，排序，统计，重新设置索引

Pandas之Dataframe叠加，排序，统计，重新设置索引的更多相关文章

随机推荐

热门专题