loc与iloc功能介绍:数据切片.通过索引来提取数据集中相应的行数据or列数据(可以是多行or多列) 总结: 不同:1. loc函数通过调用index名称的具体值来取数据2. iloc函数通过行序号来取数据3. 取多行数据时iloc不包含末尾4. 对数据进行筛选使用loc函数,当使用loc函数时,如果index不具有特定意义,而且重复,那么提取的数据需要进一步处理,可用.reset_index()函数重置index相同:1. []中无逗号时,默认取行 举例说明: #构建数据集 df1=pd.D…
df.duplicated() 参数详解: subset:检测重复的数据范围.默认为数据集的所有列,可指定特定数据列: keep: 标记哪个重复数据,默认为'first'.1.'first':标记重复数据第一次出现为True;'last':标记重复数据最后一次出现为True:False:标记所有重复数据为True. import pandas as pd #构造数据(数据集来自pandas官网 df = pd.DataFrame({ 'brand': ['Yum Yum', 'Yum Yum',…
concat函数基本介绍: 功能:基于同一轴将多个数据集合并 pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False) 参数详解:objs:待合并的所有数据集,一般为列表list,list中的元素为series或dataframeaxis:合并时参考的轴,axis=0为基于行合并:axis=…
概述 df.info():主要介绍数据集各列的数据类型,是否为空值,内存占用情况: df.describe(): 主要介绍数据集各列的数据统计情况(最大值.最小值.标准偏差.分位数等等). df.info() #导入数据 data1=pd.read_csv(r'E:\data_analysis\AB测试的假设检验实现\支付宝营销策略AB测试\effect_tb.csv',header=None,names=['dt','user_id','label','dmp_id']) data1.head…
原文链接:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html 一文看懂pandas的透视表pivot_table 一.概述 1.1 什么是透视表? 透视表是一种可以对数据动态排布并且分类汇总的表格格式.或许大多数人都在Excel使用过数据透视表,也体会到它的强大功能,而在pandas中它被称作pivot_table. 1.2 为什么要使用pivot_table? 灵活性高,可以随意定制你的分析计算要求 脉络清晰易于理解数据 操作性强,报表神…
表与表之间的数据运算 #构建数据集df1=pd.DataFrame(np.random.random(32).reshape(8,4),columns=list('ABCD')) df2=pd.DataFrame(np.arange(1,33).reshape(8,4),columns=list('ABCD')) #进行加法运算 #注:加减乘除同理 data1=df1+df2 表与列之间的计算 这里不知道有没有别的函数可以调用,或者更简单的计算方式,等我发现了再更新. #构造一个Series d…
Pandas 常见操作详解 很多人有误解,总以为Pandas跟熊猫有点关系,跟gui叔创建Python一样觉得Pandas是某某奇葩程序员喜欢熊猫就以此命名,简单介绍一下,Pandas的命名来自于面板数据这个概念,即Panel datas ,说起面板我想很多人脑海里第一印象会是宝塔,这里对面板数据不做过多介绍,有兴趣的可以自行百度. Pandas的功能有多强大不需要我过多解释,有人拿Excel和它对比,两者很显然不在同一水平.当然,对Python一窍不通的初学者可能觉得Pandas一点都不友好,…
Linux Shell数组常用操作详解 1数组定义: declare -a 数组名 数组名=(元素1 元素2 元素3 ) declare -a array array=( ) 数组用小括号括起,数组元素之间用空格分开 2显示数组长度: [@tc_132_227 dm_pid_day]$ echo ${#array[@]} [@tc_132_227 dm_pid_day]$ echo ${#array[*]} 命令: ${#数组名[@或*]} 获取数组长度,若数组无元素,输出空 3读取数组元素:…
pandas中df.ix, df.loc, df.iloc 的使用场景以及区别: https://stackoverflow.com/questions/31593201/pandas-iloc-vs-ix-vs-loc-explanation # Note: in pandas version 0.20.0 and above, ix is deprecated and the use of loc and iloc is encouraged instead. # First, a reca…
SQL 中详解round(),floor(),ceiling()函数的用法和区别? 原创 2013年06月09日 14:00:21   摘自:http://blog.csdn.net/yueliangge910101/article/details/9064021           应用中使用四舍五入的值,我和我的用户在报表应用中的计算问题存在分歧.所有的代码都在T-SQL中,但是我认为报表问题与数据类型和向下取整或向上取整规则关系密切.请问您有没有这方面的高见?我想看到一些带有不同编码选项的…