Pandas | 10 排序

Pandas有两种排序方式，它们分别是 -

按标签
按实际值

import pandas as pd

import numpy as np

df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['col2','col1'])

print (df)

输出结果：

       col2      col1

  1.069838  0.096230

 -0.542406 -0.219829

 -0.071661  0.392091

  1.399976 -0.472169

  0.428372 -0.624630

  0.471875  0.966560

 -0.131851 -1.254495

  1.180651  0.199548

  0.906202  0.418524

  0.124800  2.011962

在df数据值中，标签和值未排序。下面来看看如何按标签来排序。

按标签排序

使用sort_index()方法，通过传递axis参数和排序顺序，可以对DataFrame进行排序。 默认情况下，按照升序对行标签进行排序。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=df.sort_index()

print (sorted_df)

输出结果：

       col2      col1

0  0.431384 -0.401538

1  0.111887 -0.222582

2 -0.166893 -0.237506

3  0.476472  0.508397

4  0.670838  0.406476

5  2.065969 -0.324510

6 -0.441630  1.060425

7  0.735145  0.972447

8 -0.051904 -1.112292

9  0.134108  0.759698

排序顺序

　　通过将布尔值传递给升序参数，可以控制排序顺序。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df = df.sort_index(ascending=False)

print (sorted_df)

输出结果：

       col2      col1

9  0.750452  1.754815

8  0.945238  2.079394

7  0.345238 -0.162737

6 -0.512060  0.887094

5  1.163144  0.595402

4 -0.063584 -0.185536

3 -0.275438 -2.286831

2 -1.504792 -1.222394

1  1.031234 -1.848174

0 -0.615083  0.784086

按列排列

　　通过传递axis参数值为0或1，可以对列标签进行排序。默认情况下，axis = 0，逐行排列。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=df.sort_index(axis=1)

print (sorted_df)

输出结果：

       col1      col2

1 -0.997962  0.736707

4  1.196464  0.703710

6 -0.387800  1.207803

2  1.614043  0.356389

3 -0.057181 -0.551742

5  1.034451 -0.731490

9 -0.564355  0.892203

8 -0.763526  0.684207

0 -1.213615  1.268649

7  0.316543 -1.450784

按值排序

sort_values()是按值排序的方法。它接受一个by参数，它将使用要与其排序值的DataFrame的列名称。

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by='col1')

print (sorted_df)

输出结果：

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

注意：观察上面的输出结果，col1值被排序，相应的col2值和行索引将随col1一起改变。因此，它们看起来没有排序。

可以传递多个列，前列相同的情况下，排后列

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by=['col1','col2'])

print (sorted_df)

输出结果：

   col1  col2

2     1     2

1     1     3

3     1     4

0     2     1

排序算法

sort_values()提供了从mergeesort，heapsort和quicksort中选择算法的一个配置。Mergesort是唯一稳定的算法。

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by='col1' ,kind='mergesort')

print (sorted_df)

输出结果：

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Pandas | 10 排序的更多相关文章

Pandas数据排序
Pandas数据排序 .sort_index() 在指定轴上根据索引进行排序,索引排序后内容会跟随排序 b = pd.DataFrame(np.arange(20).reshape(4,5),inde ...
pandas数据排序（series排序 & DataFrame排序）
# pandas数据排序 # series的排序: # Series.sort_values(ascending = True,inplace = False) # 参数说明: # ascending ...
Pandas的排序和排名（Series， DataFrame） + groupby
根据条件对数据集排序(sorting)也是一种重要的内置运算.要对行或列索引进行排序(按字典顺序), 可使用sort_index 方法, 它将返回一个已排序的新对象: 而DataFrame, 则可以根 ...
10.排序数组中和为给定值的两个数字[Find2NumbersWithGivenSum]
[题目] 输入一个已经按升序排序过的数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字.要求时间复杂度是O(n).如果有多对数字的和等于输入的数字,输出任意一对即可. 例如输入数组1 ...
pandas 数据排序.sort_index()和.sort_values()
原文链接:https://www.jianshu.com/p/f0ed06cd5003 import pandas as pd df = pd.DataFrame(……) 说明:以下“df”为Data ...
pandas sort_values 排序后， index 也发生了改变，不改变的情况下需要 reset_index(drop = True)
shenpi.sort_values(by=['apply_date'],ascending=True,inplace=True)shenpi.reset_index(drop = True)
Python数据分析Pandas库之熊猫(10分钟二)
pandas 10分钟教程(二) 重点发法分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...
10大排序算法——Java实现
算法与实现选择排序算法思想从数组中选择最小元素,将它与数组的第一个元素交换位置.再从数组剩下的元素中选择出最小的元素,将它与数组的第二个元素交换位置.不断进行这样的操作,直到将整个数组排序. 动 ...
pandas 学习笔记【持续更新】
import numpy as np import pandas as pd import matplotlib.pyplot as plt df1 = pd.DataFrame(np.arange( ...

随机推荐

C++语言编程规范
前言这里参考了<高质量C++C 编程指南林锐>.<google C++编程指南>以及<华为C++语言编程规范>编写了这份C++语言编程规范文档,以合理使用 C+ ...
SQL -------- TOP 查询前几行
SELECT TOP 子句用于指定要返回的记录数量.并不是所有的数据库系统都支持SELECT TOP子句.MySQL支持LIMIT子句来选择有限数量的记录,而Oracle使用ROWNUM. top 后 ...
五、Hexo静态博客背景及界面显示优化配置
示例预览:我的主页背景图片添加自动切换背景静态本地背景首先将已选定的背景图片放到博客根目录下的\source\images下示例:D:\Blog\source\images\backgr ...
图解微信小程序---获取电影列表
图解微信小程序---获取电影列表代码笔记 list跳转第一步:编写前端页面获取相关的电影列表参数(对于显示参数不熟悉,可以先写js,通过console Log的方式获取我们电影的相关数据字段,后 ...
GAN——生成手写数字
<Generative Adversarial Nets>是 GAN 系列的鼻祖.在这里通过 PyTorch 实现 GAN ,并且用于手写数字生成. 摘要: 我们提出了一个新的框架,通过对 ...
Bootstrap3-导航
Bootstrap 导航 1. 定义导航组件基本结构:  <ul class="nav"> <li class=&qu ...
Python 绘图与可视化 matplotlib 动态条形图 bar
bar的参考链接:https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.pyplot.bar.html 第一种办法一种方法是每次都重新画,包括清除f ...
开发--CentOS-7安装及配置
开发|CentOS-7安装及配置本文主要进行详细讲解CentOS7.5系统的安装过程,以及CentOS系统初始化技术.我并不想将这篇文章变成一个教程,尽管我将详细的进行每一步的讲解,enjoy! 前 ...
Linux命令2
http://note.youdao.com/noteshare?id=172b36da28e63a528f2cb70fb7d9ea96 http://note.youdao.com/noteshar ...
ES6 Promise对象(七)
一.Promise介绍1.Promise简单说就是一个容器,里面保存着某个未来才会结束的事件(通常是一个异步操作)的结果2.Promise可以将异步操作以同步操作的流程表达出来,避免了层层嵌套的回调函 ...

Pandas | 10 排序

按标签排序

排序顺序

按列排列

按值排序

排序算法

Pandas | 10 排序的更多相关文章

随机推荐

热门专题