pandas 应用

类似vlookup

import pandas as pd

file = pd.read_csv('NIN411PF.CSV', encoding='ANSI')

a = pd.DataFrame({'PNUM95':['1609724175'],

                  'REFN95':['899270']

                  })

#按2个条件查询

file1 = pd.merge(file, a, on=['PNUM95','REFN95'])

file1.to_csv('abc.csv')

获取列标集, 行标集

后面不能加（）

df.columns

df.index

增加一列

import numpy as np
import pandas as pd

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])
df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])
df3 = pd.DataFrame(np.ones((3,4))*2, columns=['a','b','c','d'])

res = pd.concat([df1, df2, df3])
res['e']=None
print(res)

增加2列

import numpy as np

import pandas as pd

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((3,4))*2, columns=['a','b','c','d'])

res = pd.concat([df1,df2,df3])
res = pd.concat([res, pd.DataFrame(columns=['AAA', 'bbb'])])

#要加sort,

横向合并

import numpy as np

import pandas as pd

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((4,4))*2, columns=['a','b','c','d'])

res = pd.concat([df1,df2,df3], axis=1)

res = pd.concat([df1,df2,df3], axis=0, ignore_index=True)    #axis=0 纵向合并， index行标重新编写

加3列

import numpy as np

import pandas as pd

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((4,4))*2, columns=['a','b','c','d'])

res = pd.concat([df1,df2,df3], axis=0, ignore_index=True)

df = pd.concat([res, pd.DataFrame(columns=['x','y','z'])])

print(df)

字符转换

import numpy as np

import pandas as pd

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((4,4))*2, columns=['a','b','c','d'])

res = pd.concat([df1,df2,df3], axis=0, ignore_index=True)

res = res.astype({'a':'str'，'b':'str'})  #a, b列转成字符，

#res = res.astype(str) #整个数据表全转成字符

print(res.a)

分割一列为多列，修改列标

import numpy as np

import pandas as pd

res = pd.read_csv('Book1.csv')

df1 = res.Item.str.split('-', expand=True)  # 按 - 分割， 加 expand=True

df2 = pd.concat([res, df1], axis=1)

df2.columns = ['a','b','c','d','e']  #重新设置列表

df2.rename(columns={'e':'xx'}, inplace=True)  #修改制定列名, 加 inplace=True

print(df2)

修改行标列标

>>>data.rename(index={'A':'D', 'B':'E', 'C':'F'}, columns={'a':'d', 'b':'e', 'c':'f'}, inplace = True)

>>>data

print(df2.head(0))  ##返回data的前几行数据，默认为前五行，需要前十行则data.head(10)
print(df2.tail(1))  #返回data的后几行数据，默认为后五行，需要后十行则data.tail(10)

pandas 应用的更多相关文章

pandas基础-Python3
未完 for examples: example 1: # Code based on Python 3.x # _*_ coding: utf-8 _*_ # __Author: "LEM ...
10 Minutes to pandas
摘要一.创建对象二.查看数据三.选择和设置四.缺失值处理五.相关操作六.聚合七.重排(Reshaping) 八.时间序列九.Categorical类型十.画图十一 ...
利用Python进行数据分析(15) pandas基础: 字符串操作
字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join( ...
利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
pandas.DataFrame对行和列求和及添加新行和列
导入模块: from pandas import DataFrame import pandas as pd import numpy as np 生成DataFrame数据 df = DataFra ...
pandas.DataFrame排除特定行
使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame 如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()方法,将需要的行的值以列 ...

随机推荐

网络基础之2——TCP/IP参考模型
本内容主要来源于<看透Spring MVC源码分析与实践——韩路彪>一书 BS结构网络传输的分解方式有两种: 1.OSI参考模型. 2.TCP/IP参考模型. OSI和TCP/IP分层模型 ...
[django]django查询最佳实战
from django.db.models import Max, Min, Sum, Avg, Count, Q, F Django中的F和Q函数一.F介绍作用:操作数据表中的某列值,F()允许 ...
C#/ASP.NET应用程序配置文件app.config/web.config的增、删、改操作，无法为请求的 Configuration 对象创建配置文件。
应用程序配置文件,对于asp.net是 web.config,对于WINFORM程序是 App.Config(ExeName.exe.config). 配置文件,对于程序本身来说,就是基础和依据,其本 ...
一个简单的sel server 函数的自定义
创建自定义函数:use 数据库名gocreate function 函数名(@pno int)returns intasbegin declare @a int if not exists(se ...
Ubuntu install mysql database
简要说下ubuntu Linux下安装MySql数据库一. 安装 # apt-get install mysql-server# apt-get install mysql-client 二.启动 ...
js中两个!!的理解
在js中经常有两个!!出现,经常让人难以理解 (function () { var a = 10; var b = 20; function add(num1, num2) { var num1 = ...
vue2.0项目中 localhost改成ip地址访问
这里你可以写成你的ip 那你的项目只能ip访问了,但是写成0.0.0.0的话你既可已localhost 访问也可以ip访问也可以写成 127.0.0.1也可以,也能local访问了和ip访问( ...
dotnet 命令
以下用实例串起dotnet常用命令,带你玩转dotnet命令. 1．创建(dotnet new) 首先我们创建一个项目,这里我们创建控制台程序,命令如下图所示. dotnet new dotnet n ...
php实现记住密码下次自动登陆
这篇博客里面还写到实现“记住我的登录状态”的功能方法,简言之,就是对首先对session进行用户信息赋值,检测session,失效后,利用cookie对其赋值: 在实现过程中,根据网上一些代码贴,整 ...
ssdb使用笔记
ssdb是一款类似于redis的nosql数据库,不过redis是基于内存的,服务器比较昂贵,ssdb则是基于硬盘存储的,很容易扩展,对于一些对速度要求不是太高的应用,还是不错的选择. 先记录一个比较 ...

pandas 应用

pandas 应用的更多相关文章

随机推荐

热门专题