pandas-18 reindex用法

pandas中的reindex方法可以为series和dataframe添加或者删除索引。

方法：serise.reindex()、dataframe.reindex()

如果新添加的索引没有对应的值，则默认为nan。如果减少索引，就相当于一个切片操作。

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

np.random.seed(666)

# series reindex

s1 = Series([1, 2, 3, 4], index=['A', 'B', 'C', 'D'])

print(s1)

'''

A    1

B    2

C    3

D    4

dtype: int64

'''

# 重新指定 index， 多出来的index，可以使用fill_value 填充

print(s1.reindex(index=['A', 'B', 'C', 'D', 'E'], fill_value = 10))

'''

A     1

B     2

C     3

D     4

E    10

dtype: int64

'''

s2 = Series(['A', 'B', 'C'], index = [1, 5, 10])

print(s2)

'''

1     A

5     B

10    C

dtype: object

'''

# 修改索引，

# 将s2的索引增加到15个

# 如果新增加的索引值不存在，默认为 Nan

print(s2.reindex(index=range(15)))

'''

0     NaN

1       A

2     NaN

3     NaN

4     NaN

5       B

6     NaN

7     NaN

8     NaN

9     NaN

10      C

11    NaN

12    NaN

13    NaN

14    NaN

dtype: object

'''

# ffill ： foreaward fill 向前填充，

# 如果新增加索引的值不存在，那么按照前一个非nan的值填充进去

print(s2.reindex(index=range(15), method='ffill'))

'''

0     NaN

1       A

2       A

3       A

4       A

5       B

6       B

7       B

8       B

9       B

10      C

11      C

12      C

13      C

14      C

dtype: object

'''

# reindex dataframe

df1 = DataFrame(np.random.rand(25).reshape([5, 5]), index=['A', 'B', 'D', 'E', 'F'], columns=['c1', 'c2', 'c3', 'c4', 'c5'])

print(df1)

'''

         c1        c2        c3        c4        c5

A  0.700437  0.844187  0.676514  0.727858  0.951458

B  0.012703  0.413588  0.048813  0.099929  0.508066

D  0.200248  0.744154  0.192892  0.700845  0.293228

E  0.774479  0.005109  0.112858  0.110954  0.247668

F  0.023236  0.727321  0.340035  0.197503  0.909180

'''

# 为 dataframe 添加一个新的索引

# 可以看到 自动 扩充为 nan

print(df1.reindex(index=['A', 'B', 'C', 'D', 'E', 'F']))

''' 自动填充为 nan

         c1        c2        c3        c4        c5

A  0.700437  0.844187  0.676514  0.727858  0.951458

B  0.012703  0.413588  0.048813  0.099929  0.508066

C       NaN       NaN       NaN       NaN       NaN

D  0.200248  0.744154  0.192892  0.700845  0.293228

E  0.774479  0.005109  0.112858  0.110954  0.247668

F  0.023236  0.727321  0.340035  0.197503  0.909180

'''

#　扩充列，　也是一样的

print(df1.reindex(columns=['c1', 'c2', 'c3', 'c4', 'c5', 'c6']))

'''

         c1        c2        c3        c4        c5  c6

A  0.700437  0.844187  0.676514  0.727858  0.951458 NaN

B  0.012703  0.413588  0.048813  0.099929  0.508066 NaN

D  0.200248  0.744154  0.192892  0.700845  0.293228 NaN

E  0.774479  0.005109  0.112858  0.110954  0.247668 NaN

F  0.023236  0.727321  0.340035  0.197503  0.909180 NaN

'''

# 减小 index

print(s1.reindex(['A', 'B']))

''' 相当于一个切割效果

A    1

B    2

dtype: int64

'''

print(df1.reindex(index=['A', 'B']))

''' 同样是一个切片的效果

         c1        c2        c3        c4        c5

A  0.601977  0.619927  0.251234  0.305101  0.491200

B  0.244261  0.734863  0.569936  0.889996  0.017936

'''

# 对于一个 serie 来说，可以使用 drop，来丢掉某些 index

print(s1.drop('A'))

''' 就只剩下 三个了

B    2

C    3

D    4

dtype: int64

'''

# dataframe drop(A) 直接去掉一行

print(df1.drop('A', axis=0))

''' axis 默认 是 行

         c1        c2        c3        c4        c5

B  0.571883  0.254364  0.530883  0.295224  0.352663

D  0.858452  0.379495  0.593284  0.786078  0.949718

E  0.556276  0.643187  0.808664  0.289422  0.501041

F  0.737993  0.286072  0.332714  0.873371  0.421615

'''

print(df1.drop('c1', axis=1))

''' 将 c1 的列 去掉

         c2        c3        c4        c5

A  0.326681  0.247832  0.601982  0.145905

B  0.373961  0.393819  0.439284  0.926706

D  0.558490  0.617851  0.461280  0.373102

E  0.030434  0.566498  0.383103  0.739243

F  0.982220  0.989826  0.957863  0.411514

'''

pandas-18 reindex用法的更多相关文章

Pandas之groupby( )用法笔记
groupby官方解释 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True ...
Pandas中Loc用法总结
摘自:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html 具体用法,假设数据源为: > ...
pandas Timestamp的用法
(Timestamp('2018-08-01 00:00:00'), <class 'pandas._libs.tslibs.timestamps.Timestamp'>) 注意这里面的T ...
Py修行路 Pandas 模块基本用法
pandas 安装方法:pip3 install pandas pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的模块. pandas的主要功能: 具备对其功能的数据结构D ...
numpy和pandas和matplotlib用法
numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...
python3 pandas DataFrame常见用法
df = pandas.read_clipboard() df 获取索引和值 df.index df.values DataFrame的values属性将数据以二维ndarray形式返回,dtype类 ...
pandas的DataFrame用法
用来生成DataFrame数据 1.说明: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=F ...
Pandas的基本用法
Pandas是使用python进行数据分析不可或缺的第三方库.我们已经知道,NumPy的ndarray数据结构能够很好地进行数组运算,但是当我们需要进行为数据添加标签,处理缺失值,对数据分组,创建透视 ...
pandas.Series函数用法
class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) e.g., ...

随机推荐

16-cmake语法-OpeCV3.3.1_CMakeLists.txt的部分注释
OpeCV3.3.1 的 CMakeLists.txt 的部分注释. # Disable in-source builds to prevent source tree corruption. # @ ...
pptpd pptpctrl[25553]: segfault at 0 ip 00007fb6fe23ebdc sp 00007ffdef6334e8 error 4 in libc-2.17.so[7fb6fe0dd000+1c2000] pptp拨号连接失败
以下是一次记录pptpd vpn无法连接后的心酸历程: pptp client拨号发现一直无响应,查看日志因为pptpd服务端是一台高质量公网地址,所以平时拨入vpn连接都非常快,今天发起拨 ...
CSRF跨域伪造请求
后端生成一个加密token,将其设置在cookie当中,专用于表单数据提交时的验证,并且前端在表单中多增加一个隐藏字段,每当用户提交表单数据时(post请求),将这个隐藏字段一并提交,后端再对表单中的 ...
前端/H5/JS：通过URL下载文件并转存到其他服务器（微信），Blob文件转File文件
现在有一个图片URL,在自己服务器上,一个微信提供的媒体文件上传URL,我在前端通过JS实现转存微信服务器 1. http://file.xxx.com/asd.jpg 自己的 2.https://a ...
java 多态（向上转型）
多态的定义与使用格式多态的定义格式:就是父类的引用变量指向子类对象父类类型变量名 = new 子类类型(); 变量名.方法名(); 普通类多态定义的格式父类变量名 = new 子类(); ...
学习知识点的比较好的blog
树状数组 https://blog.csdn.net/flushhip/article/details/79165701 FFT https://blog.csdn.net/ggn_2015/arti ...
px转rem vue vscode
1.vscode中安装px2rem 2.打开settings.json ,新增 "px2rem.rootFontSize": 75, 3.重启vscode 4.可以转换了
Eclipse对spring-boot，spring-boot-mybatis的搭建
1.准备工作 1.1.如果没有sts(spring tool suite)插件, 则需要下载. 1.1.1.eclipse下载的话,一定要注意版本,因为eclipse会直接下载最新版本,如果ts版本 ...
关于 Object.defineProperty()
通常,定义或者修改一个JS对象,有以下方式: // 1. 字面量 let obj = { name: 'cedric', age: 18 } // 2. new Object() let obj = ...
基于ZYNQ的uart传输任意长度的数据
1.参考 UG585 网络笔记参考:ZYNQ进阶之路14–PS端uart串口接收不定长数据 2.理论知识参见上一次实验:基于ZYNQ 的UART中断实验之串口写数据到DDR3中 3.实验目的基于 ...

pandas-18 reindex用法

pandas-18 reindex用法

pandas-18 reindex用法的更多相关文章

随机推荐

热门专题