panda库------对数据进行操作---合并，转换，拼接

 >>> frame2

        addr  age   name

 0   beijing   12  zhang

 1  shanghai   24     li

 2  hangzhou   24    cao

 >>> frame1

        addr   name

 0   beijing  zhang

 1  shanghai     li

 2  hangzhou    cao

 3  shenzhen    han

 >>> pd.merge(frame1,frame2)   以name列为连接进行拼接

        addr   name  age

 0   beijing  zhang   12

 1  shanghai     li   24

 2  hangzhou    cao   24

 >>> pd.merge(frame1,frame2,on='name')     指定  列  和拼接方式

      addr_x   name    addr_y  age

 0   beijing  zhang   beijing   12

 1  shanghai     li  shanghai   24

 2  hangzhou    cao  hangzhou   24

 >>> pd.merge(frame1,frame2,on='name',how='outer')

      addr_x   name    addr_y   age

 0   beijing  zhang   beijing  12.0

 1  shanghai     li  shanghai  24.0

 2  hangzhou    cao  hangzhou  24.0

 3  shenzhen    han       NaN   NaN

 >>> pd.merge(frame1,frame2,on='name',how='inner')

      addr_x   name    addr_y  age

 0   beijing  zhang   beijing   12

 1  shanghai     li  shanghai   24

 2  hangzhou    cao  hangzhou   24

 >>> pd.merge(frame1,frame2,on='name',how='left')

      addr_x   name    addr_y   age

 0   beijing  zhang   beijing  12.0

 1  shanghai     li  shanghai  24.0

 2  hangzhou    cao  hangzhou  24.0

 3  shenzhen    han       NaN   NaN

 >>> pd.merge(frame1,frame2,on='name',how='right')

      addr_x   name    addr_y  age

 0   beijing  zhang   beijing   12

 1  shanghai     li  shanghai   24

 2  hangzhou    cao  hangzhou   24

 >>> pd.merge(frame1,frame2,on='name',left_index=True)

      addr_x   name    addr_y  age

 0   beijing  zhang   beijing   12

 1  shanghai     li  shanghai   24

 2  hangzhou    cao  hangzhou   24

 >>> pd.merge(frame1,frame2,on='name',right_index=True)

      addr_x   name    addr_y  age

 0   beijing  zhang   beijing   12

 1  shanghai     li  shanghai   24

 2  hangzhou    cao  hangzhou   24

 >>> pd.merge(frame1,frame2,on='addr',right_index=True)

        addr name_x  age name_y

 0   beijing  zhang   12  zhang

 1  shanghai     li   24     li

 2  hangzhou    cao   24    cao

 >>> frame1.columns=['addr1','name1']

 >>> frame1.join(frame2)

       addr1  name1      addr   age   name    修改掉重复的列名称，然后join（）

 0   beijing  zhang   beijing  12.0  zhang

 1  shanghai     li  shanghai  24.0     li

 2  hangzhou    cao  hangzhou  24.0    cao

 3  shenzhen    han       NaN   NaN    NaN

 >>> array1

 array([[0, 1, 2],

        [3, 4, 5],

        [6, 7, 8]])

 >>> array1=np.arange(9).reshape((3,3))+6

 >>> array2=np.arange(9).reshape((3,3))

 >>> array1

 array([[ 6,  7,  8],

        [ 9, 10, 11],

        [12, 13, 14]])

 >>> np.concatenate([array1,array2],axis=1)   np模块中对元组进行concatenate（）

 array([[ 6,  7,  8,  0,  1,  2],

        [ 9, 10, 11,  3,  4,  5],

        [12, 13, 14,  6,  7,  8]])

 >>> np.concatenate([array1,array2],axis=0)

 array([[ 6,  7,  8],

        [ 9, 10, 11],

        [12, 13, 14],

        [ 0,  1,  2],

        [ 3,  4,  5],

        [ 6,  7,  8]])

 >>>

 >>> np.concatenate([array1,array2])

 array([[ 6,  7,  8],

        [ 9, 10, 11],

        [12, 13, 14],

        [ 0,  1,  2],

        [ 3,  4,  5],

        [ 6,  7,  8]])

 >>> ser1=pd.Series(np.random.rand(4))   pd模块中也有concat（）

 >>> ser1

 0    0.998915

 1    0.117503

 2    0.747180

 3    0.641508

 dtype: float64

 >>> ser1=pd.Series(np.random.rand(4)*100)

 >>> ser1

 0     8.818592

 1    42.317816

 2    43.274021

 3    23.245148

 dtype: float64

 >>> ser2=pd.Series(np.random.rand(4)*100,index=[5,6,7,8])

 >>> ser2

 5    58.416554

 6    11.840838

 7    38.146851

 8     0.135517

 dtype: float64

 >>> pd.concat([ser1,ser2])

 0     8.818592

 1    42.317816

 2    43.274021

 3    23.245148

 5    58.416554

 6    11.840838

 7    38.146851

 8     0.135517

 dtype: float64

 >>> pd.concat([ser1,ser2],axis=1)

            0          1

 0   8.818592        NaN

 1  42.317816        NaN

 2  43.274021        NaN

 3  23.245148        NaN

 5        NaN  58.416554

 6        NaN  11.840838

 7        NaN  38.146851

 8        NaN   0.135517

 >> pd.concat([ser1,ser2],axis=1,keys=[1,2])

            1          2

 0   8.818592        NaN

 1  42.317816  79.632793

 2  43.274021  96.700070

 3  23.245148  64.573269

 4        NaN  68.629709

 >>> ser2.index=[2,4,5,6]

 >>> ser2

 2    79.632793

 4    96.700070

 5    64.573269

 6    68.629709

 dtype: float64

 >>> ser1.combine_first(ser2)    对缺额的数据进行填充  combin_first()

 0     8.818592

 1    42.317816

 2    43.274021

 3    23.245148

 4    96.700070

 5    64.573269

 6    68.629709

 dtype: float64

 >>> ser1

 0    a

 1    b

 2    c

 3    d

 dtype: object

 >>> ser2

 2    0

 4    1

 5    2

 6    3

 dtype: int32

 >>> ser2.combine_first(ser1)   ser1在后

 0    a

 1    b

 2    0

 3    d

 4    1

 5    2

 6    3

 dtype: object

 >>> ser1[:2].combine_first(ser2)  ser1在前

 0    a

 1    b

 2    0

 4    1

 5    2

 6    3

 dtype: object

 >>> frame1=pd.DataFrame({'name':['zhang','li','wang'],'age':[12,45,34],'addr':['beijing','shanghai','shenzhen']})

 >>> frame1

        addr  age   name

 0   beijing   12  zhang

 1  shanghai   45     li

 2  shenzhen   34   wang

 >>> frame1.stack()        frame的进栈和出栈

 0  addr     beijing

    age           12

    name       zhang

 1  addr    shanghai

    age           45

    name          li

 2  addr    shenzhen

    age           34

    name        wang

 dtype: object

 >>> frame1.stack().unstack()

        addr age   name

 0   beijing  12  zhang

 1  shanghai  45     li

 2  shenzhen  34   wang

 >>> frame1.stack().unstack(0)   列和索引转换

             0         1         2

 addr  beijing  shanghai  shenzhen

 age        12        45        34

 name    zhang        li      wang

 >>> longframe=pd.DataFrame({'color':['white','white','white','red','red','red','black','black','black'],'item':['ball','pen','mug','ball','pen','mug','ball','pen','mug'],'value':np.random.rand(9)})

 >>> longframe

    color  item     value        对冗余的消除，将longframe转换为wideframe

 0  white  ball  0.260358

 1  white   pen  0.543955

 2  white   mug  0.456874

 3    red  ball  0.967021

 4    red   pen  0.657271

 5    red   mug  0.984256

 6  black  ball  0.550236

 7  black   pen  0.731625

 8  black   mug  0.006728

 >>> wideframe=longframe.pivot('color','item')

 >>> wideframe

           value

 item       ball       mug       pen

 color

 black  0.550236  0.006728  0.731625

 red    0.967021  0.984256  0.657271

 white  0.260358  0.456874  0.543955

 >>> frame1

        addr  age   name

 0   beijing   12  zhang

 1  shanghai   12     li

 2   beijing   12   wang

 >>> del frame['addr']

 Traceback (most recent call last):

   File "<pyshell#103>", line 1, in <module>

     del frame['addr']

 NameError: name 'frame' is not defined

 >>> del frame1['addr']

 >>> frame1

    age   name

 0   12  zhang

 1   12     li

 2   12   wang

panda库------对数据进行操作---合并，转换，拼接的更多相关文章

mysql数据表操作&库操作
首先登陆mysql:mysql -uroot -proot -P3306 -h127.0.0.1 查看所有的库:show databases; 进入一个库:use database; 显示所在的库:s ...
MySQL数据库（2）- 库的操作、表的操作、数据的操作、存储引擎的介绍
一.库的操作 1.系统数据库执行如下命令,查看系统数据库: mysql> show databases; 参数解释: information_schema: 虚拟库,不占用磁盘空间,存储的是数 ...
SSIS从理论到实战,再到应用(7)----常用的数据类型转换操作
原文:SSIS从理论到实战,再到应用(7)----常用的数据类型转换操作上期回顾: SSIS从理论到实战,再到应用(6)----SSIS的自带日志功能在抽取各种应用的数据时候,经常会遇到数据需要转 ...
使用SQLServer同义词和SQL邮件，解决发布订阅中订阅库丢失数据的问题
最近给客户做了基于SQLServer的发布订阅的“读写分离”功能,但是某些表数据很大,经常发生某几条数据丢失的问题,导致订阅无法继续进行.但是每次发现问题重新做一次发布订阅又非常消耗时间,所以还得根据 ...
JAVASE02-Unit08：文本数据IO操作、异常处理
Unit08: 文本数据IO操作 . 异常处理 * java.io.ObjectOutputStream * 对象输出流,作用是进行对象序列化 package day08; import java.i ...
MySQL的数据库，数据表，数据的操作
数据库简介概念什么是数据库?简单来说,数据库就是存储数据的"仓库", 但是,光有数据还不行,还要管理数据的工具,我们称之为数据库管理系统! 数据库系统 = 数据库管理系统 + ...
SQL Server 跨库同步数据
最近有个需求是要跨库进行数据同步,两个数据库分布在两台物理计算机上,自动定期同步可以通过SQL Server代理作业来实现,但是前提是需要编写一个存储过程来实现同步逻辑处理.这里的存储过程用的不是op ...
让复杂Json数据和对象自由转换 --- Gson
Gson是谷歌用于对Json操作的库,里面有着强大而又方便的功能,最常用的就是 fromJson():将json数据转化为对象: toJson():将对象转化为json数据! 对于普通的json数据使 ...
HealthKit开发快速入门教程之HealthKit数据的操作
HealthKit开发快速入门教程之HealthKit数据的操作数据的表示在HealthKit中,数据是最核心的元素.通过分析数据,人们可以看到相关的健康信息.例如,通过统计步数数据,人们可以知道 ...

随机推荐

轻量级ORM框架 QX_Frame.Bantina（二、框架使用方式介绍）
轻量级ORM框架QX_Frame.Bantina系列讲解(开源) 一.框架简介 http://www.cnblogs.com/qixiaoyizhan/p/7417467.html 二.框架使用方式介 ...
陈年佳酿之 - Winform ListView 控件 double click 事件中获取选中的row与column
背景最近收到了一个关于以前项目的维护请求,那时的楼主还是刚刚工作的小青年~~~ 项目之前使用的是.net/winform.今天重新打开代码,看着之前在FrameWork2.0下面的代码, 满满的回忆 ...
【Js应用实例】限制上传图片大小
需求:前端页面开发中,常遇到图片上传的需求,一般要求限制图片格式及大小. 说明:这里就把实现此功能所需代码贴出来,供同志们参考,也方便我以后复用. 要点:1.处理类型type为file的输入元素的v ...
jsp基本语法及运行原理
一.jsp简介 JSP全名为Java Server Pages,中文名叫java服务器页面,其根本是一个简化的Servlet设计,它是由Sun Microsystems公司倡导.许多公司参与一起建立 ...
在Linux 环境下搭建 JDK 和 Tomcat
在Linux 环境下搭建 JDK 和 Tomcat 参考地址:http://www.cnblogs.com/liulinghua90/p/4661424.html [JDK安装] 1.首先下载 ...
poj2912 Rochambeau
Description N children are playing Rochambeau (scissors-rock-cloth) game with you. One of them is th ...
spring文件上传
Spring文件上传 1,导包: <dependency> <groupId>javax.servlet</groupId> <artifactId>s ...
switch_to 家族
selenium做自动化的过程中,经常会遇到alert.frame和新的window,这是经常是switch_to家族大展拳脚的时候,先看看switch_to家族的成员: alert --返回浏览器的 ...
帆软的报表系统与泛微OA结合起来，这两个软件麦枫提供了经典的服务。
一.集成配景泛微OA对企业的代价泛微协同办公计划能向你供给一个协同的.集成的办公情况,使所有的办公职员都在统一且个性化的信息流派中一路事情, 解脱光阴和地区的限定,实现协同事情与知识治理. Eoco ...
【ASP.NET MVC】View与Controller之间传递数据
1 概述本篇文章主要从操作上简要分析Controller<=>View之间相互传值,关于页面之间传值,如果感兴趣,可参考我另外一篇文章ASP.NET 页面之间传值的几种方式 . Co ...

panda库------对数据进行操作---合并，转换，拼接

panda库------对数据进行操作---合并，转换，拼接的更多相关文章

随机推荐

热门专题