python之pandas&&DataFrame(二)

简单操作

Python-层次聚类-Hierarchical clustering

>>> data = pd.Series(np.random.randn(10),index=[['a','a','a','b','b','c','c','d','d','d'],[1,2,3,1,2,1,2,3,1,2]])

>>> data

a  1   -0.168871

   2    0.828841

   3    0.786215

b  1    0.506081

   2   -2.304898

c  1    0.864875

   2    0.183091

d  3   -0.678791

   1   -1.241735

   2    0.778855

dtype: float64

Hierarchical与DataFrame之间的转换

>>> data.unstack()

          1         2         3

a -0.168871  0.828841  0.786215

b  0.506081 -2.304898       NaN

c  0.864875  0.183091       NaN

d -1.241735  0.778855 -0.678791

>>> type(data.unstack())

<class 'pandas.core.frame.DataFrame'>

Merge,join,Concatenate

>>> df2 = pd.DataFrame({'apts':[55000,60000],'cars':[15000,12000]},index=['hangzhou','najing'])

>>> df1 = pd.DataFrame({'apts':[55000,60000],'cars':[20000,30000]},index=['shanghai','beijing'])

>>> df3 = pd.DataFrame({'apts':[55000,60000],'cars':[15000,12000]},index=['guangzhou','chongqing'])

>>> [df1,df2,df3]

[           apts   cars

shanghai  55000  20000

beijing   60000  30000,            apts   cars

hangzhou  55000  15000

najing    60000  12000,             apts   cars

guangzhou  55000  15000

chongqing  60000  12000]

>>> pd.concat([df1,df2,df3])

            apts   cars

shanghai   55000  20000

beijing    60000  30000

hangzhou   55000  15000

najing     60000  12000

guangzhou  55000  15000

chongqing  60000  12000

frames = [df1,df2,df3]

>>> result2 = pd.concat(frames,keys=['x','y','z'])

>>> result2

              apts   cars

x shanghai   55000  20000

  beijing    60000  30000

y hangzhou   55000  15000

  najing     60000  12000

z guangzhou  55000  15000

  chongqing  60000  12000

进行拼接concat

>>> df4 = pd.DataFrame({"salaries":[10000,30000,30000,20000,15000]},index=['suzhou','beijing','shanghai','guanghzou','tianjin'])

>>> result3 = pd.concat([result,df4],axis=1)

>>> result3

              apts     cars  salaries

beijing    60000.0  30000.0   30000.0

chongqing  60000.0  12000.0       NaN

guanghzou      NaN      NaN   20000.0

guangzhou  55000.0  15000.0       NaN

hangzhou   55000.0  15000.0       NaN

najing     60000.0  12000.0       NaN

shanghai   55000.0  20000.0   30000.0

suzhou         NaN      NaN   10000.0

tianjin        NaN      NaN   15000.0

合并两个DataFrame，并且只是交集

>>> result3 = pd.concat([result,df4],axis=1,join='inner')

>>> result3

           apts   cars  salaries

shanghai  55000  20000     30000

beijing   60000  30000     30000

Series和DataFrame一起Concatenate

>>> s1 = pd.Series([60,50],index=['shanghai','beijing'],name='meal')

>>> s1

shanghai    60

beijing     50

Name: meal, dtype: int64

>>> type(s1)

<class 'pandas.core.series.Series'>

>>> df1

           apts   cars

shanghai  55000  20000

beijing   60000  30000

>>> type(df1)

<class 'pandas.core.frame.DataFrame'>

>>> pd.concat([df1,s1],axis=1)

           apts   cars  meal

shanghai  55000  20000    60

beijing   60000  30000    50

>>>

Series可以使用append进行行添加也可以列添加，但是concat不可以

>>> s2 = pd.Series([18000,12000],index=['apts','cars'],name='xiamen')

>>> s2

apts    18000

cars    12000

Name: xiamen, dtype: int64

>>> df1.append(s2)

           apts   cars

shanghai  55000  20000

beijing   60000  30000

xiamen    18000  12000

>>> pd.concat([df1,s2],axis=0)

                0     apts     cars

shanghai      NaN  55000.0  20000.0

beijing       NaN  60000.0  30000.0

apts      18000.0      NaN      NaN

cars      12000.0      NaN      NaN

>>> pd.concat([df1,s2],axis=1)

             apts     cars   xiamen

apts          NaN      NaN  18000.0

beijing   60000.0  30000.0      NaN

cars          NaN      NaN  12000.0

shanghai  55000.0  20000.0      NaN

>>>

merge合并

>>> df1 = pd.DataFrame({"salaries":[10000,30000,30000,20000,15000],'cities':['suzhou','beijing','shanghai','guanghzou','tianjin']})

>>> df4 = pd.DataFrame({'apts':[55000,60000],'cars':[15000,12000],'cities':['shanghai','beijing']})

>>> result = pd.merge(df1,df4,on='cities') #on表示合并的列                                      
>>> result

     cities  salaries   apts   cars

0   beijing     30000  60000  12000

1  shanghai     30000  55000  15000

>>> result = pd.merge(df1,df4,on='cities',how='right')

>>> result

     cities  salaries   apts   cars

0   beijing     30000  60000  12000

1  shanghai     30000  55000  15000

>>> result = pd.merge(df1,df4,on='cities',how='left')

>>> result

      cities  salaries     apts     cars

0     suzhou     10000      NaN      NaN

1    beijing     30000  60000.0  12000.0

2   shanghai     30000  55000.0  15000.0

3  guanghzou     20000      NaN      NaN

4    tianjin     15000      NaN      NaN

python之pandas&&DataFrame(二)的更多相关文章

Python：pandas（二）——pandas函数
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...
Python数据分析--Pandas知识点(二)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算新建一个数据表 ...
python之pandas&&DataFrame
1.Series Series是一个一维数组 pandas会默认从0开始作为Series的index >>> test = pd.Series(['num0','num1','nu ...
Python中pandas dataframe删除一行或一列：drop函数
用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) 参数说明:labels 就是要删除的行列的 ...
Python数据分析--Pandas知识点(三)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, ...
【338】Pandas.DataFrame
Ref: Pandas Tutorial: DataFrames in Python Ref: pandas.DataFrame Ref: Pandas:DataFrame对象的基础操作 Ref: C ...
Python 学习第十二篇：pandas
pandas是基于NumPy构建的模块,含有使数据分析更快更简单的操作工具和数据结构,最常用的数据结构是:序列Series和数据框DataFrame,Series类似于numpy中的一维数组,类似于关 ...
Python之Pandas中Series、DataFrame
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
Python常用库之二：Pandas
Pandas是用于数据操纵和分析,建立在Numpy之上的.Pandas为Python带来了两种新的数据结构:Pandas Series和Pandas DataFrame,借助这两种数据结构,我们能够轻 ...

随机推荐

【省选水题集Day1】一起来AK水题吧！题解（更新到B）
题目:http://www.cnblogs.com/ljc20020730/p/6937936.html 水题A:[AHOI2001]质数和分解安徽省选OI原题!简单Dp. 一看就是完全背包求方案数 ...
【arc075F】Mirrored
Portal --> arc075_f Solution 一开始抱着"我有信仰爆搜就可以过"的心态写了一个爆搜.. 但是因为..剪枝和枚举方式不够优秀愉快T掉了q ...
网络编程----socketserver多并发实现、FTP上传多并发、udp协议套接字多并发
一.socketserver多并发基于tcp的套接字,关键就是两个循环,一个 ...
Python高级语法总结
1.Python面向对象创建类使用class语句来创建一个新类,class之后为类的名称并以冒号结尾,如下实例: class ClassName: '类的帮助信息' #类文档字符串 class_s ...
js 多个事件的绑定及移除(包括原生写法和 jquery 写法)
需要打开控制台查看效果: <!DOCTYPE html> <html lang="en"> <head> <meta charset=&q ...
防止xss攻击的核心代码
public class XssFilter implements Filter { @Override public void destroy() { } /** * 过滤器用来过滤的方法 */ @ ...
SpringBoot (四) ：thymeleaf 使用详解
原文出处: 纯洁的微笑在上篇文章< springboot(二):web综合开发 >中简单介绍了一下thymeleaf,这篇文章将更加全面详细的介绍thymeleaf的使用.thymele ...
Codeforces 797 D. Broken BST
D. Broken BST http://codeforces.com/problemset/problem/797/D time limit per test 1 second memory lim ...
Linux上怎么快速删除一个目录
删除文件需要用到rm命令,但删除目录需要添加两个参数: -r 向下递归,不管多少级目录都删除 -f 强行删除,不做提示 #rm -rf 文件目录名
python匹配某个中文字符
python2.7对中文的支持不好是众所周知的,现在遇到这样一个需求,要匹配某个中文字符.查了一个资料,思路就是转化为unicode进行比较,记录如下: line = '参考答案: A' # gbk ...

python之pandas&&DataFrame(二)

简单操作

Python-层次聚类-Hierarchical clustering

Hierarchical与DataFrame之间的转换

python之pandas&&DataFrame(二)的更多相关文章

随机推荐

热门专题