numpy之初探排序和集合运算

排序

numpy与python列表内置的方法类似，也可通过sort方法进行排序。

用法如下：



In [1]: import numpy as np

In [2]: x = np.random.randn(9)

In [3]: x

Out[3]:

array([-0.4041504 , -0.42198556,  0.92807217, -2.66609196,  1.50915897,

        0.38080873,  1.05325796, -1.16488798,  0.04062064])

In [4]: x.sort()

In [5]: x

Out[5]:

array([-2.66609196, -1.16488798, -0.42198556, -0.4041504 ,  0.04062064,

        0.38080873,  0.92807217,  1.05325796,  1.50915897])

可以发现上述的sort方法是直接对x进行了排序而并没有创建一个副本。

但是np.sort()这个顶级的方法，会返回一个副本：

In [6]: x = np.random.randn(6)

In [7]: x

Out[7]:

array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,

        0.95574862])

In [8]: np.sort(x)

Out[8]:

array([ 0.00352338,  0.14240205,  0.22528632,  0.48903869,  0.95574862,

        1.31659382])

In [9]: x

Out[9]:

array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,

        0.95574862])

传入轴编号，可以实现在某一个轴向上进行排序。

In [34]: x = np.random.randn(5,4)

In [35]: x

Out[35]:

array([[-0.26646799, -0.40714749, -0.76788268, -0.25340467],

       [ 0.70099086, -0.88716684,  0.13461279,  2.14412835],

       [ 0.39718924, -0.14671297, -0.67821163,  1.85798273],

       [-0.29389289,  0.0346094 ,  0.25213133,  0.87105479],

       [-0.10797243,  1.60188878,  0.67829493,  0.43291808]])

In [36]: s = x

In [37]: s.sort(0)#按列进行排序

In [38]: s

Out[38]:

array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],

       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],

       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],

       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],

       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])

In [39]: x

Out[39]:

array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],

       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],

       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],

       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],

       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])

In [40]: x = np.random.randn(5,4)

In [41]: x

Out[41]:

array([[ 0.82309157, -0.56413805, -0.1766557 , -0.31924962],

       [-1.25606694,  2.63622922,  2.47481377,  0.27840961],

       [ 0.63659583,  1.52779004, -0.90582752,  0.82325241],

       [-1.52664294, -0.5285837 , -1.96380368, -0.44323125],

       [ 1.94859294,  2.55676806,  1.53614848, -0.43366557]])

In [42]: x.sort(1)#按行进行排序

In [43]: x

Out[43]:

array([[-0.56413805, -0.31924962, -0.1766557 ,  0.82309157],

       [-1.25606694,  0.27840961,  2.47481377,  2.63622922],

       [-0.90582752,  0.63659583,  0.82325241,  1.52779004],

       [-1.96380368, -1.52664294, -0.5285837 , -0.44323125],

       [-0.43366557,  1.53614848,  1.94859294,  2.55676806]])

在这儿，我试图将x赋值给s，结果发现对s排序后，x也变了，这说明，在内存中，实际上，s，x是指向同一组值得。

我也曾试图输入 s.sort(2),结果出现了ValueError: axis(=2) out of bounds,这也就和前面的统计函数的axis参数是一致的。

那么也就是说，他的用法和axis一致。

利用排序，我们还能得到分位数（

分位数（英语：Quantile），亦称分位点，是指将一个随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。具体可自行搜索），从而得到特定位置的值。



In [44]: x = np.random.randn(500)

In [45]: x.sort()

In [46]: x[int(0.05 * len(x))] #5%分位数

Out[46]: -1.7657191623368329

还有很多没有深入了解，比如怎么降序排列，待续。

集合运算

unique(x)返回集合中的唯一值，并排序，其实也就是去除重复值。



In [1]: import numpy as np

In [2]: str = np.array(['s','f','r','s','d','f','w','r'])

In [3]: np.unique(str)

Out[3]:

array(['d', 'f', 'r', 's', 'w'],

      dtype='<U1')

In [4]: i = np.array([2,2,2,2,1,1,3,4,5,4,3,5])

In [5]: np.unique(i)

Out[5]: array([1, 2, 3, 4, 5])

intersect1d(x,y)返回集合A和B的交集，并排序

In [6]: k = np.arange(8)

In [7]: np.intersect1d(i, k)

Out[7]: array([1, 2, 3, 4, 5])

union1d(x,y)返回集合A和B的并集，并排序

In [8]: np.union1d(i,k)

Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7])

in1d(x,y)返回一个A包含于B的布尔型数组



In [10]: np.in1d(k,i)

Out[10]: array([False,  True,  True,  True,  True,  True, False, False], dtype=bool)

setdiff1d(x,y)集合的差，包含于A但不包含于B,相当于A-（A∩B)



In [12]: np.setdiff1d(k,i)

Out[12]: array([0, 6, 7])

setxor1d(x,y)存在于A中但不同时存在于B中，也就是对称差，说白了就是A和B交集之外的部分。

就是红色的部分。

In [13]: s = np.arange(4,12)

In [14]: s

Out[14]: array([ 4,  5,  6,  7,  8,  9, 10, 11])

In [15]: np.setxor1d(s,k)

Out[15]: array([ 0,  1,  2,  3,  8,  9, 10, 11])

numpy之初探排序和集合运算的更多相关文章

NumPy 中的集合运算
怎样快速找出两个数组中相同的元素? numpy.isin(element,test_elements,assume_unique = False,invert = False ) 计算test_ele ...
numpy 数组集合运算及下标操作
1. 数组的集合运算 1.1. 并集 np.union1d(a,b)计算数组的并集: In [1]: import numpy as np In [2]: a = np.array([1,2,3]) ...
详解SQL集合运算
以前总是追求新东西,发现基础才是最重要的,今年主要的目标是精通SQL查询和SQL性能优化. 本系列[T-SQL基础]主要是针对T-SQL基础的总结. [T-SQL基础]01.单表查询-几道sql查询题 ...
Oracle学习(七)：集合运算
1.知识点:能够对比以下的录屏进行阅读 SQL> -- 查询10和20号部门的员工的3种方法 SQL> --1. select * from emp where deptno in (10 ...
STL中的set集合容器进行集合运算：并、交、差实例
集合容器的集合运算:并.交.差: #include "stdafx.h" #include <iostream> #include <set> #inclu ...
[SQL] SQL 基础知识梳理（七）- 集合运算
SQL 基础知识梳理(七)- 集合运算目录表的加减法联结(以列为单位) 一.表的加减法 1.集合:记录的集合(表.视图和查询的执行结果). 2.UNION(并集):表的加法 -- DDL:创建表 ...
oracle中常用的 join on 相关和集合运算的总结
sql常用联合查询的 join on . left join(左连接) . right join (右连接).inner join (等值连接)以及常用的集合运算有:union.unionall.mi ...
Oracle02——oracle分页、子查询、集合运算、处理数据、创建和管理表和其他数据库对象
作者: kent鹏转载请注明出处: http://www.cnblogs.com/xieyupeng/p/7289451.html --oracle分页(Pageing Query) select ...
numpy教程：排序、搜索和计数
http://blog.csdn.net/pipisorry/article/details/51822775 numpy排序.搜索和计数函数和方法.(重新整合过的) ],, , ], [, , ]] ...

随机推荐

Android 在 SElinux下如何获得对一个内核节点的访问权限【转】
本文转载自:https://blog.csdn.net/wh_19910525/article/details/45170755 Android 5.0下,因为采取了SEAndroid/SElinux ...
Intellij IDear关闭页面浏览器显示图标
如在xml页面或html页面,右上角老显示看着特别不爽,可以如此关闭第一步 File->setting 第二步
I方法怎么不能获取多选框的数据
前端代码 <input type="checkbox" name="m_name" value="{$vo.name}" class ...
Count and Say，统计并输出，利用递归，和斐波那契数列原理一样。
问题描述:n=1,返回“1”:n=2,返回“11”:n=3,返回“21”:n=4,返回1211,.... 算法分析:和斐波那契数列道理差不多,都是后一个要依赖前一个元素.因此可以使用递归,也可以使用迭 ...
org.apache.log4j.Logger用法
在应用程序中添加日志记录总的来说基于三个目的 :监视代码中变量的变化情况,周期性的记录到文件中供其他应用进行统计分析工作:跟踪代码运行时轨迹,作为日后审计的依据:担当集成开发环境中的调试器的作用,向文 ...
d3.js学习笔记（五）——将数据结构化为D3.js可处理的
目标在这一章,你将会理解如何对数据进行结构化,来更好的使用D3.js. 我们将会回顾我们之前已经学习的,学习D3.js如何使用选集(selections),JavaScript对象基础,以及如何最优 ...
【python教程】Python IDE
PyCharm PyCharm是由JetBrains打造的一款Python IDE. PyCharm具备一般 Python IDE 的功能,比如:调试.语法高亮.项目管理.代码跳转.智能提示.自动完成 ...
NLP（二）_汉语言分词技术-最大匹配法
前述词是自然语言中最小的有意义的构成单位.汉语文本是基于单字的文本,汉语的书面表达方式以汉字作为最小单元,词与词之间没有明显的界限标志,因此,分词是汉语文本分析处理中首先要解决的问题之一. 分词可能 ...
st表模板
http://blog.csdn.net/insistgogo/article/details/9929103 这篇博客讲解的很详细了,求区间最大值也可以用st表,时间复杂度O(n log(n)),查 ...
安装Charles报错
去年用的是charles4.1.2版本,今年这个版本的安装包始终安装报错,不管公司电脑还是自己电脑........ 我的解决方案很Lower的.......... 登录Charles官网:https: ...

numpy之初探排序和集合运算

排序

排序

集合运算

numpy之初探排序和集合运算的更多相关文章

随机推荐

热门专题