unique()与nunique()
1 unique()
统计list中的不同值时,返回的是array.它有三个参数,可分别统计不同的量,返回的都是array.
当list中的元素也是list时,尽量不要用这种方法.
import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一个array
print(np.unique(a))
# 返回该元素在list中第一次出现的索引
print(np.unique(a,return_index=True))
# 返回原list中每个元素在新的list中对应的索引
print(np.unique(a,return_inverse=True))
# 返回该元素在list中出现的次数
print(np.unique(a,return_counts=True))
# 当加参数时,unique()返回的是一个tuple,这里利用了tuple的性质,即有多少个元素即可赋值给对应的多少个变量
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5]
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2] # 注意当list中的元素不是数字而是list的时候,输出的数据类型与list中元素的长度有关
# 利用这种方法对list中元素去重或求里面元素的个数都不是好方法,很容易出错
b = [[1,2],[3,4]]
print(np.unique(b))
# b中有两个list,输出的却是4
print(len(np.unique(b)))
c = [[1,2],[3,4],[5]]
print(np.unique(c))
print(len(np.unique(c)))
# [1 2 3 4]
#
# [list([1, 2]) list([3, 4]) list([5])]
#
统计series中的不同值时,返回的是array,它没有其它参数
import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]
2 nunique()
可直接统计dataframe中每列的不同值的个数,也可用于series,但不能用于list.返回的是不同值的个数.
df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
#    A  B
# 0  0  0
# 1  1  5
# 2  1  6
# A    2
# B    3
# dtype: int64
也可与groupby结合使用,统计每个块的不同值的个数.
all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
# user_id nunique
# 0 40 1
# 1 56 1
# 2 98 1
# 3 103 1
# 4 122 1
unique()与nunique()的更多相关文章
- 读书笔记6pandas简单使用
		一.序列Series,很像numpy中的array数组,可以由列表.元组.字典.numpy中的array来初始化 >>> from pandas import Series > ... 
- LeetCode: Unique Paths I & II & Minimum Path Sum
		Title: https://leetcode.com/problems/unique-paths/ A robot is located at the top-left corner of a m ... 
- Python--unique()与nunique()函数
		参考:https://www.cnblogs.com/xxswkl/p/11009059.html 1 unique() 统计list中的不同值时,返回的是array.它有三个参数,可分别统计不同的量 ... 
- [LeetCode] Unique Substrings in Wraparound String 封装字符串中的独特子字符串
		Consider the string s to be the infinite wraparound string of "abcdefghijklmnopqrstuvwxyz" ... 
- [LeetCode] Minimum Unique Word Abbreviation 最短的独一无二的单词缩写
		A string such as "word" contains the following abbreviations: ["word", "1or ... 
- [LeetCode] Count Numbers with Unique Digits 计算各位不相同的数字个数
		Given a non-negative integer n, count all numbers with unique digits, x, where 0 ≤ x < 10n. Examp ... 
- [LeetCode] Unique Word Abbreviation 独特的单词缩写
		An abbreviation of a word follows the form <first letter><number><last letter>. Be ... 
- [LeetCode] Unique Binary Search Trees 独一无二的二叉搜索树
		Given n, how many structurally unique BST's (binary search trees) that store values 1...n? For examp ... 
- [LeetCode] Unique Binary Search Trees II 独一无二的二叉搜索树之二
		Given n, generate all structurally unique BST's (binary search trees) that store values 1...n. For e ... 
随机推荐
- RNN, LSTM, GRU cells
			项目需要,先简记cell,有时间再写具体改进原因 RNN cell LSTM cell: GRU cell: reference: 1.https://towardsdatascience.com/a ... 
- Linux下配置JDK环境
			安装前需要查询Linux中是否已经存在jdk 如果存在,将存在的jdk删除 在/etc/profile中添加以下 JAVA_HOME为jdk的安装目录 PATH为jdk可执行文件的目录 使用sourc ... 
- Python基础2——数据类型的操作
			列表操作 列表.字符串.元组的切片总结: num=[1, 2, 3, 4, 5, 6] 1.切片是通过下面来切,下标可以正数,也可以是复数.注意:复数的话,最后一个值的下标为-1,往前面推导就是-1, ... 
- mybatis报错(三)报错Result Maps collection does not contain value for java.lang.Integer解决方法
			转自:https://blog.csdn.net/zengdeqing2012/article/details/50978682 1 [WARN ] 2016-03-25 13:03:23,955 - ... 
- 如何学习ios(摘自知乎https://www.zhihu.com/question/20016551)
			著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处.作者:Wang Hailong链接:https://www.zhihu.com/question/20016551/answer/1 ... 
- JavaEE高级-SpringMVC学习笔记
			*SpringMVC概述 - Spring为展示层提供的基于MVC设计理念的优秀Web框架,是目前最主流的MVC框架之一 - Spring3.0后全面超越Struts2,成为最优秀的MVC框架 - S ... 
- fpga ip
			原文地址:altera FIR ip核 license破解作者:王永刚Aether 在证书文件中添加一段: FEATURE 6AF7_0012 alterad 2035.12 permanent un ... 
- python基础操作---tuple
			#coding:utf-8 tup1 = ('physics', 'chemistry', 1997, 2000); tup2 = (1, 2, 3, 4, 5 ); tup3 = "a&q ... 
- C#索引器2  字符串作为索引号
			6.索引器 字符串作为索引号 public class Demo { private Hashtable name = new Hashtable(); public string this[st ... 
- AtCoder Beginner Contest 089 D - Practical Skill Test
			Problem Statement We have a grid with H rows and W columns. The square at the i-th row and the j-th ... 
