pandas之DataFrame创建、索引、切片等基础操作

知识点

Series只有行索引，而DataFrame对象既有行索引，也有列索引

行索引，表明不同行，横向索引，叫index，0轴，axis=0

列索引，表明不同列，纵向索引，叫columns，1轴，axis=1

1、DataFrame创建，可以通过index和columns指定索引名称

#方式一
a = pd.DataFrame(np.arange(10).reshape(2,5))

print(a)


#方式二

a = pd.DataFrame(np.arange(10).reshape(2,5),index=list("ab"),columns=list("qwxyz"))

print(a)

#方式三

temp_dict = {"name":["yangwj","ywj"],"age":[28,29],"tel":["",""]}

a = pd.DataFrame(temp_dict)

print(a)

2、DataFrame基础属性和整体情况查询

a)基础属性

    df.shape  #行数、列数

    df.dtype #列数据类型

    df.ndim #数据维度

    df.index #行索引

    df.columns #列索引

    df.values #对象值，二维ndarray数组

b)整体情况查询

    df.head(3) #显示头部几行，默认5行

    df.tail(3) #显示末尾几行，默认5行

    df.info() #相关信息概览：行数、列数、索引、列非空值个数、列类型、内存占用

    df.describe() #快速综合统计结果： 计数、均值、标准差、最大值、四分位数、最小值等

3、通过pd.sort_values(by="Count_AnimalName",ascending=False).head(5)排序获取次数最高的排名数据

g = pd.read_csv("./youtube_video_data/dogNames2.csv")

print(g.describe())

print("*"*20)

print(g.info())

print(g.sort_values(by="Count_AnimalName",ascending=False).head(5))

4、切片与索引a)常规获取

　　# 方括号写数组，表示取行，对行进行操作

　　# 写字符串，表示取列索引，对列进行操作

　　print(a[:3]) #取前3行

　　print(a["Row_Labels"])#取列


b)通过loc和iloc获取

　　#df.loc 通过标签索引行或列数据

　　#df.iloc通过位置获取行数据 iloc --> index location

　　a = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("wxyz"))

　　print(a)

　　print(a.loc["a",:]) #取一行

　　print(a.loc[["a","c"],:])#取多行

　　print(a.loc[:,["x","y"]])#取多列

　　print(a.iloc[1,:])#取行

　　print(a.iloc[:,1])#取列

　　print(a.iloc[[1,2],[2,3]])#取多行多列

c)布尔索引获取,可以通过&或者|做多条件布尔获取
　　g = g[g["Count_AnimalName"]>800]
　　print(g)
　　print(g[(g["Count_AnimalName"]>800) & (g["Count_AnimalName"]<1000) ])

　　#通过字符串长度进行选取
　　print(g[(g["Row_Labels"].str.len()>4) & (g["Count_AnimalName"]<1000) ])

5、pandas之字符串方法

pandas之DataFrame创建、索引、切片等基础操作的更多相关文章

python pandas ---Series,DataFrame 创建方法,操作运算操作(赋值,sort,get,del,pop,insert,+,-,*,/)
pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包 pandas 也是围绕着 Series 和 DataFrame 两个核心数据结构展开的, 导入如下: from panda ...
4.Lucene3.案例介绍，创建索引，查询等操作验证
案例: Article.java package cn.toto.lucene.quickstart; publicclassArticle { privateintid; private St ...
Pandas之DataFrame——Part 1
''' [课程2.] Pandas数据结构Dataframe:基本概念及创建 "二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符 ...
mongo之前后台创建索引 --noIndexBuildRetry
在数据量超大的情形下,任何数据库系统在创建索引时都是一个耗时的大工程.MongoDB也不例外.因此,MongoDB索引的创建有两个选择,一个是前台方式,一个是后台方式.那这两种方式有什么差异呢,在创建 ...
numpy和pandas的基础索引切片
Numpy的索引切片索引 In [72]: arr = np.array([[[1,1,1],[2,2,2]],[[3,3,3],[4,4,4]]]) In [73]: arr Out[73]: a ...
Python array,list,dataframe索引切片操作 2016年07月19日——智浪文档
array,list,dataframe索引切片操作 2016年07月19日——智浪文档 list,一维,二维array,datafrme,loc.iloc.ix的简单探讨 Numpy数组的索引和切片 ...
数据分析入门——pandas之DataFrame多层/多级索引与聚合操作
一.行多层索引 1.隐式创建在构造函数中给index.colunms等多个数组实现(datafarme与series都可以) df的多级索引创建方法类似: 2.显式创建pd.MultiIndex 其 ...
Pandas的基础操作（一）——矩阵表的创建及其属性
Pandas的基础操作(一)——矩阵表的创建及其属性 (注:记得在文件开头导入import numpy as np以及import pandas as pd) import pandas as pd ...
Pandas之Dataframe叠加，排序，统计，重新设置索引
Pandas之Dataframe索引,排序,统计,重新设置索引一:叠加 import pandas as pd a_list = [df1,df2,df3] add_data = pd.concat ...

随机推荐

关于STM32运行时程序卡在B.处的解决方法
文章转载自:https://blog.csdn.net/u014470361/article/details/78780444 背景: 程序运行时,发现程序卡死在B.处. 解决方法: 程序卡死在B.处 ...
nacos 1.1.x 集群部署笔记
Nacos 是什么? https://nacos.io/zh-cn/docs/what-is-nacos.html 服务(Service)是 Nacos 世界的一等公民.Nacos 支持几乎所有主流类 ...
Redis05——Redis高级运用（管道连接，发布订阅，布隆过滤器）
Redis高级运用一.管道连接redis(一次发送多个命令,节省往返时间) 1.安装nc yum install nc -y 2.通过nc连接redis nc localhost 6379 3.通过 ...
zencart用sql将某个产品属性值设为只读和默认
zencart用sql将某个产品属性值设为只读和默认 UPDATE `products_attributes` SET `attributes_display_only` = '1', `attrib ...
SpringBoot 上传读取图片巨坑
之前自己也做过文件上传,不过存储路径放在那个tomcat服务器路径下,就没遇到什么问题但前几天在做图片的上传,想把文件放在项目下指定的一个文件夹下,就感觉有点麻烦修改配置文件在springboo ...
jupyter lab 报错
C:\Users\WQBin>jupyter lab [I :: kernels found [I :: No cio_test package found. [I ::45.137 LabAp ...
__slots__节约空间
1.为什么要使用__slots__ Python 使用 dicts(hash table)缓存大量的静态资源(属性). 我们最近在Image类中,用仅仅一行__slots__代码,改变成使用tuple ...
java+Word图片上传控件
这种方法是servlet,编写好在web.xml里配置servlet-class和servlet-mapping即可使用后台(服务端)java服务代码:(上传至ROOT/lqxcPics文件夹下) ...
Java进阶知识05 Hibernate联合主键之Annotation（注解）和XML实现方式
1.Hibernate联合主键(Annotation实现) 1.1.单列主键 1.1.1.为什么要有主键? //唯一确定一条记录 1.1.2.一个表能否有多个主键? //不能 1.1.3. ...
洛谷 P1135 奇怪的电梯（dfs）
题目描述呵呵,有一天我做了一个梦,梦见了一种很奇怪的电梯.大楼的每一层楼都可以停电梯,而且第i层楼(1<=i<=N)上有一个数字Ki(0<=Ki<=N).电梯只有四个按钮:开 ...

pandas之DataFrame创建、索引、切片等基础操作

pandas之DataFrame创建、索引、切片等基础操作的更多相关文章

随机推荐

热门专题