loc() iloc() at() iat()函数

1 四个函数都是用于dataframe的定位

[]用于直接定位.

loc()函数是用真实索引,iloc()函数是用索引序号.

loc()函数切片是左闭右闭,iloc()函数切片是左闭右开.

at(),iat()的关系同上.

import pandas as pd

import numpy as np

df = pd.DataFrame(np.arange(24).reshape(6,4), columns=list('ABCD'), index=list('abcdef'))

print(df)

# 直接切片定位法   总结:取行时只能用切片,取列时只能用list选择列名

# 切片行时

# 注意切片用真实索引时是左闭右闭,

print(df['a':'d'])

# 用索引序号时是左闭右开

print(df[0:3])

# 当真实索引和索引序号相同时,切片是左闭右开

print(df.reset_index())

print(df.reset_index()[0:3])

# 切片列时

# 列索引必须是用真实索引,不能用索引序号,否则报错

print(df['a':'d'][['C','D']])

print(df['a':'d'])

# 且此方法不能对列名做切片,会报错

# print(df[['B':'D']])

# print(df[0:3][[2:3]])

#　loc()函数定位法

# loc()函数的固定结构如下,先写行索引,再写列索引

# 注意loc()的切片是左闭右闭,iloc()的切片是左闭右开

print(df.loc['b':'e',['A','D']])

print(df.loc[ df['A']> 8])

# 会报错,loc()只接受真实索引,iloc()只接受索引的序号,即必须是整数

# print(df.loc[ 2:4, ['A','D']])

# iloc()函数定位法

# iloc()只接受索引的序号,切片是左闭右开,同直接[]切片定位方法用索引序号时是一样的

print(df.iloc[0:4, 1:3])

# at()函数

# 只能定位单个元素，无法定位多个,用法同loc()

print(df.at['a','C'])

# iat()函数

# 只能定位单个元素，无法定位多个,用法同iloc()

print(df.iat[0,2])

# ix()

# 当索引列是时间时，允许用未在索引列中出现的时间做切片

# 在pandas版本0.20.0及其以后版本中，ix已经不被推荐使用，建议采用iloc和loc实现ix。

import random

import datetime as dt

rnd_1 = [random.randrange(1,20) for x in range(1000)]

rnd_2 = [random.randrange(1,20) for x in range(1000)]

rnd_3 = [random.randrange(1,20) for x in range(1000)]

fecha = pd.date_range('2012-4-10', '2015-1-4')

data = pd.DataFrame({'fecha':fecha, 'rnd_1': rnd_1, 'rnd_2': rnd_2, 'rnd_3': rnd_3})

print(data.describe())

date_1 = dt.datetime(2013, 1, 10, 8, 30)

date_2 = dt.datetime(2013, 1, 13, 4, 20)

data_fecha = data.set_index('fecha')

print(data_fecha.ix[date_1: date_2])

# print(data_fecha.loc[date_1,date_2])

# 参考：https://blog.csdn.net/wr339988/article/details/65446138

#     A   B   C   D

# a   0   1   2   3

# b   4   5   6   7

# c   8   9  10  11

# d  12  13  14  15

# e  16  17  18  19

# f  20  21  22  23

#     A   B   C   D

# a   0   1   2   3

# b   4   5   6   7

# c   8   9  10  11

# d  12  13  14  15

#    A  B   C   D

# a  0  1   2   3

# b  4  5   6   7

# c  8  9  10  11

#   index   A   B   C   D

# 0     a   0   1   2   3

# 1     b   4   5   6   7

# 2     c   8   9  10  11

# 3     d  12  13  14  15

# 4     e  16  17  18  19

# 5     f  20  21  22  23

#   index  A  B   C   D

# 0     a  0  1   2   3

# 1     b  4  5   6   7

# 2     c  8  9  10  11

#     C   D

# a   2   3

# b   6   7

# c  10  11

# d  14  15

#     A   B   C   D

# a   0   1   2   3

# b   4   5   6   7

# c   8   9  10  11

# d  12  13  14  15

#     A   D

# b   4   7

# c   8  11

# d  12  15

# e  16  19

#     A   B   C   D

# d  12  13  14  15

# e  16  17  18  19

# f  20  21  22  23

#     B   C

# a   1   2

# b   5   6

# c   9  10

# d  13  14

#

#

#              rnd_1        rnd_2        rnd_3

# count  1000.000000  1000.000000  1000.000000

# mean      9.912000    10.140000    10.134000

# std       5.370204     5.461156     5.458006

# min       1.000000     1.000000     1.000000

# 25%       5.000000     5.000000     5.000000

# 50%      10.000000    10.000000    10.000000

# 75%      14.000000    15.000000    15.000000

# max      19.000000    19.000000    19.000000

#             rnd_1  rnd_2  rnd_3

# fecha

# 2013-01-11      6     14      9

# 2013-01-12     10     19     11

# 2013-01-13     14      4     14

2 loc()函数用于定位dataframe的某些行,可以进行切片操作,当只定位一行时,数据类型是series.

有时想要按dataframe中的某一列按条件进行索引时,可以将该列设置为索引列,即可用loc函数进行索引定位.

import pandas as pd

df = pd.DataFrame([

            ['green', 'M', 10.1, 'class1'],

            ['red', 'L', 13.5, 'class2'],

            ['blue', 'XL', 15.3, 'class1']],

                 columns=['a','b','c','d'])

print(df)

print(df.loc[2][1])

print(type(df.loc[2]))

print(df.loc[:,'a'])  # 也可以选择多列输出

#        a   b     c       d

# 0  green   M  10.1  class1

# 1    red   L  13.5  class2

# 2   blue  XL  15.3  class1

# XL

# <class 'pandas.core.series.Series'>

# 0    green

# 1      red

# 2     blue

# Name: a, dtype: object

3 利用loc()函数定位dataframe的某些行后，可直接赋值修改某些列的值.特别要注意另一种写法不能修改值.

df = pd.DataFrame({ 'a': [3,4,3,7],

                    'b': [6,2,3,4],

                    'c': [3,5,4,3]})

# 注意想要修改满足条件的c列的值时,要把c列写入[]内

df.loc[(df['a'] == 3) & (df['b'] == 3),'c'] = '把我的值修改了'

df.loc[(df['a'] == 3) & (df['b'] == 3),'b'] = '把我的值也修改了'

print(df)

# 如下这种写法不会修改值,

print('第三行a列的值是：',df.loc[2].a)

df.loc[2].a = 999

print(df)

#    a         b        c

# 0  3         6        3

# 1  4         2        5

# 2  3  把我的值也修改了  把我的值修改了

# 3  7         4        3

# 第三行a列的值是： 3

#    a         b        c

# 0  3         6        3

# 1  4         2        5

# 2  3  把我的值也修改了  把我的值修改了

# 3  7         4        3

用series给series赋值时，一定要注意后面加上.values，否则容易出错.

import pandas as pd

df1 = pd.DataFrame({'a':[1,1,2,2],

                    'b':[2,4,6,8]})

df2 = pd.DataFrame({'c':[3,3,4,4],

                    'd':[6,7,8,9]})

print(df1)

print(df2)

# loc[]后定位的b列是series类型

print(type(df1.loc[ df1.a == 1, 'b']))

# 可以直接用list或ndarray进行赋值，不会出错

df1.loc[ df1.a == 1, 'b'] = [888,999]

print(df1)

# 注意这里赋值的时候右边生成的是series类型，如果与左边的series索引对不上，

# 就会出现空值，所以为了保险起见，加上.values就一定不会出错

df1.loc[ df1.a == 1, 'b'] = (df1.loc[df1.a == 2, 'b'] + df2.loc[df2.c == 4, 'd']).values

print(df1)

#    a  b

# 0  1  2

# 1  1  4

# 2  2  6

# 3  2  8

#    c  d

# 0  3  6

# 1  3  7

# 2  4  8

# 3  4  9

# <class 'pandas.core.series.Series'>

#    a    b

# 0  1  888

# 1  1  999

# 2  2    6

# 3  2    8

#    a   b

# 0  1  14

# 1  1  17

# 2  2   6

# 3  2   8

4 注意用loc选值的时候要用values[0]

import pandas as pd

df1 = pd.DataFrame({'a':[1,1,2,3],

                    'b':[2,4,6,8]})

print(df1)

# 注意这里想要取出对应的值要用values[0].

a = df1.loc[df1['a'] == 2, 'b'].values[0]

print(type(a))

print(a)

#    a  b

# 0  1  2

# 1  1  4

# 2  2  6

# 3  3  8

# <class 'numpy.int64'>

#

loc() iloc() at() iat()函数的更多相关文章

pandas DataFrame的查询方法（loc,iloc,at,iat,ix的用法和区别）
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas中Dataframe的查询方法（[], loc, iloc, at, iat, ix）
数据介绍先随机生成一组数据: import pandas as pd import numpy as np state = ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'N ...
pandas 选取数据修改数据 loc iloc []
pandas选取数据可以通过 loc iloc [] 来选取使用loc选取某几列: user_fans_df = sample_data.loc[:,['uid','fans_count']] 使 ...
Pandas：loc iloc ix用法
参考:Pandas中关于 loc \ iloc \ ix 用法的理解相同点使用形式都是 df.xxx[ para1 , para2 ] #xxx表示loc iloc ix#df表示一个DataFr ...
loc iloc函数的区别
import pandas as pd data1 = pd.read_excel(r"G:\Python\example1.xlsx") loc 用行列标签,iloc用数字索引. ...
Pandas中关于 loc \ iloc 用法的理解
转载至:https://blog.csdn.net/w_weiying/article/details/81411257 loc函数:通过行索引 "Index" 中的具体值来取行数 ...
pandas 定位 loc,iloc,ix
In [114]: df Out[114]: A B C D 2018-06-30 0.318501 0.613145 0.485612 0.918663 2018-07-31 0.614796 0. ...
学习笔记6—pandas中ix,loc,iloc有什么区别？
直接看例子: >>> data = pd.Series(np.arange(10), index=[49,48,47,46,45, 1, 2, 3, 4, 5]) >>& ...
Pandas的 loc iloc ix 区别
先看代码: In [46]: import pandas as pd In [47]: data = [[1,2,3],[4,5,6]] In [48]: index = [0,1] In [49]: ...

随机推荐

mysql时间类型
转自:http://www.cnblogs.com/Matrix54/archive/2012/05/01/2478158.html AVA中获取当前系统时间一. 获取当前系统时间和日期并格式化输出 ...
Axiso解决跨域访问
问题: 在项目中需要需要讲本地项目去请求一个URL接口获取数据例如: 本地请求地址:http://127.0.0.1:19323/site/info.json 请求Url地址:http://www. ...
Apache 安装后启动出现的错误
错误信息 1: configure: error: APR not found 解决方法:yum install apr* -y 错误信息 2:httpd: apr_sockaddr_info_get ...
linux extglob模式和rm反选，除了某个文件外的其他文件全部删除的命令
1.extglob模式开启之后Shell可以另外识别出5个模式匹配操作符,能使文件匹配更加方便. 不然不识别 #开启命令: shopt -s extglob #关闭命令: shopt -u extgl ...
Springboot配置文件占位符
一.配置文件占位符 1.application.properties server.port=8088 debug=false product.id=ID:${random.uuid} product ...
如何删除Github上的仓库
1.首先,进入自己的github账户页面,点击头像选择下面的Your repositorys,点击进入 2.进入以后选中自己要删除的仓库,点击进去该仓库界面 3.找到Settings按钮,点击进入 4 ...
Flask【第2篇】：Flask基础
Flask基础知识点回顾 1.flask依赖wsgi,实现wsgi的模块:wsgiref,werkzeug,uwsgi 2.实例化Flask对象,里面是有参数的 app = Flask(__name ...
Textarea随着文本的字数自适应高度，后来发现用 contenteditable 代替textarea 效果更佳
做移动端项目遇到很多问题,最近比如textarea 随着文本的字数自动撑开高度, 网上也查阅了一些资料发现比较有用的方法就是获取 textarea的行数和换行符来动态改变textarea的高度就 ...
Arduino-原理图标识
VCC 电源正极 VDD GNG 电源负极 VSS vin 表示输入电源 TXD RXD 是主板串口通信用的接口,TXD表示发送数据,RXD表示接收数据,还有简 ...
Java面试之基础篇（4）
31.String s = new String("xyz");创建了几个StringObject?是否可以继承String类? 两个或一个都有可能,”xyz”对应一个对象,这个对 ...

loc() iloc() at() iat()函数

loc() iloc() at() iat()函数的更多相关文章

随机推荐

热门专题