Pandas排序

Pandas有两种排序方式，它们分别是 -

按标签
按实际值

下面来看看一个输出的例子。

import pandas as pd

import numpy as np

unsorted_df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],colu

mns=['col2','col1'])

print (unsorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

1  1.069838  0.096230

4 -0.542406 -0.219829

6 -0.071661  0.392091

2  1.399976 -0.472169

3  0.428372 -0.624630

5  0.471875  0.966560

9 -0.131851 -1.254495

8  1.180651  0.199548

0  0.906202  0.418524

7  0.124800  2.011962

Shell

在unsorted_df数据值中，标签和值未排序。下面来看看如何按标签来排序。

按标签排序

使用sort_index()方法，通过传递axis参数和排序顺序，可以对DataFrame进行排序。默认情况下，按照升序对行标签进行排序。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=unsorted_df.sort_index()

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

0  0.431384 -0.401538

1  0.111887 -0.222582

2 -0.166893 -0.237506

3  0.476472  0.508397

4  0.670838  0.406476

5  2.065969 -0.324510

6 -0.441630  1.060425

7  0.735145  0.972447

8 -0.051904 -1.112292

9  0.134108  0.759698

Shell

排序顺序

通过将布尔值传递给升序参数，可以控制排序顺序。来看看下面的例子来理解一下。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df = unsorted_df.sort_index(ascending=False)

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

9  0.750452  1.754815

8  0.945238  2.079394

7  0.345238 -0.162737

6 -0.512060  0.887094

5  1.163144  0.595402

4 -0.063584 -0.185536

3 -0.275438 -2.286831

2 -1.504792 -1.222394

1  1.031234 -1.848174

0 -0.615083  0.784086

Shell

按列排列

通过传递axis参数值为0或1，可以对列标签进行排序。默认情况下，axis = 0，逐行排列。来看看下面的例子来理解这个概念。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=unsorted_df.sort_index(axis=1)

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col1      col2

1 -0.997962  0.736707

4  1.196464  0.703710

6 -0.387800  1.207803

2  1.614043  0.356389

3 -0.057181 -0.551742

5  1.034451 -0.731490

9 -0.564355  0.892203

8 -0.763526  0.684207

0 -1.213615  1.268649

7  0.316543 -1.450784

Shell

按值排序

像索引排序一样，sort_values()是按值排序的方法。它接受一个by参数，它将使用要与其排序值的DataFrame的列名称。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by='col1')

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Shell

注意：观察上面的输出结果，col1值被排序，相应的col2值和行索引将随col1一起改变。因此，它们看起来没有排序。

通过by参数指定需要列值，参考以下示例代码 -

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by=['col1','col2'])

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

2     1     2

1     1     3

3     1     4

0     2     1

Shell

排序算法

sort_values()提供了从mergeesort，heapsort和quicksort中选择算法的一个配置。Mergesort是唯一稳定的算法。参考以下示例代码 -

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by='col1' ,kind='mergesort')

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Pandas排序的更多相关文章

第七节：pandas排序
pandas具有两种排序方式:sort_index()和sort_values().
pandas 排序之 sort_values，reindex，reset_index， sort_index
如果想按照自己的方式排序ind = 行索引data= data[ind] ind = data.sum(axis=1).sort_values(ascending=False).index data ...
pandas 按照某一列进行排序
pandas排序的方法有很多,sort_values表示根据某一列排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序,inp ...
Pandas学习笔记（三）
(1)系列对象( Series)基本功能编号属性或方法描述 1 axes 返回行轴标签列表. 2 dtype 返回对象的数据类型(dtype). 3 empty 如果系列为空,则返回True. ...
媲美pandas的数据分析工具包Datatable
1 前言 data.table 是 R 中一个非常通用和高性能的包,使用简单.方便而且速度快,在 R 语言社区非常受欢迎,每个月的下载量超过 40 万,有近 650 个 CRAN 和 Biocondu ...
pandas的用法
1.a = pandas.read_csv(filepath):读取.csv格式的文件到列表a中,文件在路径filepath中 pandas.core.frame.DataFrame是pandas的核 ...
送你一个Python 数据排序的好方法
摘要:学习 Pandas排序方法是开始或练习使用 Python进行基本数据分析的好方法.最常见的数据分析是使用电子表格.SQL或pandas 完成的.使用 Pandas 的一大优点是它可以处理大量数据 ...
Python人工智能学习笔记
Python教程 Python 教程 Python 简介 Python 环境搭建 Python 中文编码 Python 基础语法 Python 变量类型 Python 运算符 Python 条件语句 ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...

随机推荐

ASP.Net请求处理机制初步探索之旅 - Part 2 核心(转)
开篇:上一篇我们了解了一个请求从客户端发出到服务端接收并转到ASP.Net处理入口的过程,这篇我们开始探索ASP.Net的核心处理部分,借助强大的反编译工具,我们会看到几个熟悉又陌生的名词(类):Ht ...
YOLO v1论文笔记
You Only Look Once:Unified, Real-Time Object Detection 论文链接:https://arxiv.org/abs/1506.02640 Homep ...
如果"一切是IO"“一切是file”是成立的，那么上述的想法也一定可以实现吧 awk对apache日志分析 ---
定时执行自动化处理直接入库再去读取这个file入库: root@VM---ubuntu:/var/log/apache2# awk '{print $1 "\t" $7}' ...
sqlalchemy(二)高级用法　２
转自:https://www.cnblogs.com/coder2012/p/4746941.html 外键以及relationship 首先创建数据库,在这里一个user对应多个address,因此 ...
pycharm的MySQLdb模块导不进去时解决办法
一.Windows下python2.7安装MySQLdb模块根据Python多少位下载对应版本: 32位:https://pypi.python.org/pypi/MySQL-python/1.2. ...
centos7 Dockerfile安装nginx
1.写一个Dockerfile文件 FROM centos MAINTAINER apeng apeng@apenglinux-002.com RUN yum install -y pcre-deve ...
jquery获取浏览器类型和版本号的方法
$(document).ready(function(){ varbrow=$.browser; varbInfo=""; if(brow.msie){bInfo="Mi ...
bitmap位图法
位图法定义位图法就是bitmap的缩写,所谓bitmap,是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况.通常是用来判断某个数据存不存在的. 例如,要判断一千万个人的状态,每 ...
windows下的Mysql安装与基本使用(msi)
一.安装方式 1.msi(其他版本:https://www.cnblogs.com/zjiacun/p/6653891.html) 2.zip 这里我们用msi吧,只是单纯练习的话,简单很多二.ms ...
phpexcel导出带生成图片完美案例
// 导出exl public function look_down(){ $id = I('get.id'); $m = M ('offer_goods'); $where['offer_id'] ...

Pandas排序

按标签排序

排序顺序

按列排列

按值排序

排序算法

Pandas排序的更多相关文章

随机推荐

热门专题