pandas基础（第一章（一））

摘要：通过简单例子，了解功能。以此作为基点，在工作中不断深入

1.设置需要显示的行列宽度（显示的最大列数和最大行数，其余部分用.....表示）

设置显示多少行多少列

import pandas as pd

import numpy as np

pd.set_option('max_columns',5,'max_rows',5)

df = pd.read_csv('20190708.csv')

print(df)

'''

pd.set_option('max_columns',3,'max_rows',3)

      Unnamed: 0  ...      circ_mv

0              0  ...  142940.1406

...          ...  ...          ...

3608        3608  ...  466813.2600

[3609 rows x 19 columns]

pd.set_option('max_columns',5,'max_rows',5)

      Unnamed: 0    ts_code  ...     total_mv      circ_mv

0              0  603639.SH  ...  443175.0623  142940.1406

1              1  600130.SH  ...  294144.0000  294144.0000

...          ...        ...  ...          ...          ...

3607        3607  600017.SH  ...  947301.3975  947301.3975

3608        3608  601038.SH  ...  774878.1000  466813.2600

[3609 rows x 19 columns]

'''

1.pd.set_option

2.提取df索引，并对索引操作

import pandas as pd

import numpy as np

pd.set_option('max_columns',5,'max_rows',5)

df = pd.read_csv('20190708.csv')

print(df)

column_ = df.columns

index_ = df.index

data_ = df.values

print(column_)

print(index_)

print(data_)

print(type(column_))         ##<class 'pandas.core.indexes.base.Index'>

print(type(column_.values))  ##class 'numpy.ndarray'

print(type(column_.tolist()))##<class 'list'>

2.1提取索引，数据类型转化

说明：

1.列索引提取出来的数据类型都是Index对象<class 'pandas.core.indexes.base.Index'>

　　通过column_.values获得## <class 'numpy.ndarray'>数组类

通过column_.tolist()获得##<class 'list'> 列表类

2.行索引与列索引类似

　　3.访问索引内的值

　　print(column_.values[1]) ##ts_code同数组取值一样

　　print(index_.tolist()[1]) ## 1 同list取值一样

　　4.重命名行列索引

　　df.index = index_list ##新的行名列表直接赋值

　　df.columns = column_list

　　　　说明：局部行改名，可以先提取行索引，转化成列表，更改对应名称，之后执行df.index = index_list操作。

　　　　也可以通过df.rename(index=idx_rename,columns=col_rename),其中idx_rename、col_rename是字典{“旧名”：新名}

3.df取值的方式之标签索引和位置索引

　　3.1基于标签（索引）.loc

　　　　单个标签0（解释为标签）或‘a’,列表或数组标签['a','b','c'],带标签的切片‘a’:'f',布尔数组，一个callable带一个参数的函数

　3.1基于标签（索引）.loc的行列取值

　　　布尔数组及callable取值后续更新

　　3.2基于位置（整数）.iloc （从0到len-1，位置索引不能超过这个索引范围）

　　　　基于位置索引的取值方式，大体上与基于标签索引的取值方式一致。

import pandas as pd

import numpy as np

df = pd.read_csv('20190708.csv')

##取0行1列位置的值

print(df.iloc[0,1])

##取指位置定行,返回一个series序列

print(df.iloc[0,:])

##取指定位置列，返回一个series序列

print(df.iloc[:,1])

##行位置切片

print(df.iloc[0:5,:])

##列位置切片

print(df.iloc[:,0:5])

##指定行位置（不连续）多个

print(df.iloc[[0,3,6],:])

##指定列位置（不连续）多个

print(df.iloc[:,[0,2,4]])

##指定行列位置多个

print(df.iloc[[0,3,6],[0,2,4]])

3.2基于位置索引

4.属性访问

　　我们通过一个例子，来说明通过属性访问的实现过程

##获得一个序列

series_1 = dfa.ts_code

print(series_1)

通过属性运算'.'的方式获取ts_code这一列的数据，返回一个series序列，这个是数字索引，怎么通过属性获取其中的值（目前不清楚），这里用索引取series_1中的值

　　　　print(series_1[1]) ##返回 600130.SH

　　　　print(series_1) ##输出如下

　　　　print(series_1.b)

import pandas as pd

import numpy as np

df = pd.read_csv('20190708.csv')

dfa = df.iloc[[0,1,2,3],[1,2,3,4]]

dfa.index = ['a','b','c','d']

print(dfa)

##获得一个序列

series_1 = dfa.ts_code

print(series_1)

print(series_1.b)

完整代码

5.通过可调用选择（按条件选取）

　　.loc .iloc 及 []可以接受一个callable索引器。

import pandas as pd

import numpy as np

df = pd.read_csv('20190708.csv')

dfa = df.iloc[[0,1,2,3],[1,2,3,4]]

dfa.index = ['a','b','c','d']

print(dfa)

##显示满足条件的行(.iloc同理)

print(dfa.loc[lambda df:dfa.close>4,:])

##显示满足条件的列(.iloc同理)

print(dfa.loc[:,lambda df:['close','ts_code']])

##[]取 一列数据

print(dfa[lambda dfa:dfa.columns[0]])

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

b  600130.SH    20190708   3.83         1.6078

c  000692.SZ    20190708   3.05         0.7804

d  300596.SZ    20190708  31.98         1.1319

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

d  300596.SZ    20190708  31.98         1.1319

   close    ts_code

a  26.12  603639.SH

b   3.83  600130.SH

c   3.05  000692.SZ

d  31.98  300596.SZ

a    603639.SH

b    600130.SH

c    000692.SZ

d    300596.SZ

Name: ts_code, dtype: object

Process finished with exit code 0

6.布尔操作过滤数据

|（or） &(and) ~(not) ,使用时需用括号进行分组

import pandas as pd

import numpy as np

df = pd.read_csv('20190708.csv')

dfa = df.iloc[[0,1,2,3],[1,2,3,4]]

dfa.index = ['a','b','c','d']

##对序列操作

series_2 = dfa.close

print(series_2)

##显示序列中大于4的所有数据

print(series_2[series_2>4])

##显示序列中大于4或者小于3.5的

print(series_2[(series_2>4)|(series_2<3.5)])

##显示大于4且 小于30的

print(series_2[(series_2>4)&(series_2<30)])

##显示不大于4的

print(series_2[~(series_2>4)])

##对df操作

print(dfa[dfa['close']>4])

print(dfa[(dfa['close']>4)&(dfa['turnover_rate']>2)])

a    26.12

b     3.83

c     3.05

d    31.98

Name: close, dtype: float64

a    26.12

d    31.98

Name: close, dtype: float64

a    26.12

c     3.05

d    31.98

Name: close, dtype: float64

a    26.12

Name: close, dtype: float64

b    3.83

c    3.05

Name: close, dtype: float64

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

d  300596.SZ    20190708  31.98         1.1319

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

Process finished with exit code 0

import pandas as pd

import numpy as np

df = pd.read_csv('20190708.csv')

dfa = df.iloc[[0,1,2,3],[1,2,3,4]]

dfa.index = ['a','b','c','d']

print(dfa)

##使用map函数,判断指定列是否以‘6’开头

criterion = dfa['ts_code'].map(lambda x:x.startswith(''))

print(criterion)  ##先产生布尔结果

print(dfa[criterion])  ##在筛选显示

##使用三元表达式筛选

dfb = dfa[[x.startswith('') for x in dfa['ts_code']]]

print(dfb )

##多条件筛选

dfc = dfa[criterion & (dfa['trade_date']==20190708)]

print(dfc)

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

b  600130.SH    20190708   3.83         1.6078

c  000692.SZ    20190708   3.05         0.7804

d  300596.SZ    20190708  31.98         1.1319

a     True

b     True

c    False

d    False

Name: ts_code, dtype: bool

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

b  600130.SH    20190708   3.83         1.6078

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

b  600130.SH    20190708   3.83         1.6078

     ts_code  trade_date  close  turnover_rate

a  603639.SH    20190708  26.12         2.4992

b  600130.SH    20190708   3.83         1.6078

pandas基础（第一章（一））的更多相关文章

20190804-Python基础第一章
学习爬虫的同时,补充学习更多Python的基础知识,才能让所学更加扎实. 至今,所学的很多东西,基础都不牢固,导致这些所学都是浅尝则止的皮毛,不能真正上战场,故借速成之心,踏实打牢基础,举一反三,以求 ...
python基础第一章
Python基础第一个python程序变量程序交互基本数据类型格式化输出基本运算符流程控制if...else... 流程控制-循环第一个python程序文件执行 1.用notepad ...
java基础第一章
有一定的基础,但是还是要重新开始,2020.10.6 1.手写Hello World public class HelloWorld{ public static void main(String[] ...
JAVA基础第一章-初识java
业内经常说的一句话是不要重复造轮子,但是有时候,只有自己造一个轮子了,才会深刻明白什么样的轮子适合山路,什么样的轮子适合平地! 从今天开始,我将会持续更新java基础知识,欢迎关注. java的诞生 ...
C语言基础-第一章
1.常量直接常量: int mm=100; float nn=100.01; 字符常量: 编译指令,#define 常量名常量值 (预处理命令,预处理命令都#开头.成为宏命令) 关键字, ...
深入学习重点分析java基础---第一章：深入理解jvm(java虚拟机) 第一节 java内存模型及gc策略
身为一个java程序员如果只会使用而不知原理称其为初级java程序员,知晓原理而升中级.融会贯通则为高级作为有一个有技术追求的人,应当利用业余时间及零碎时间了解原理近期在看深入理解java虚拟机 ...
Vue基础第一章
Vue的简单示例 <!DOCTYPE html> <html> <head> <meta charset="utf-8"> < ...
JAVA基础第二章-java三大特性：封装、继承、多态
业内经常说的一句话是不要重复造轮子,但是有时候,只有自己造一个轮子了,才会深刻明白什么样的轮子适合山路,什么样的轮子适合平地! 我将会持续更新java基础知识,欢迎关注. 往期章节: JAVA基础第一 ...
JAVA 入门第一章（语法基础）
本人初学java 博客分享记录一下自己的学习历程 java我的初步学习分为六章,有c和c++的基础学起来也简便了很多. 第一章语法基础第二章面向对象第三章常用工具类第四章文件操纵第五章 ...
.net架构设计读书笔记--第一章基础
第一章基础第一节软件架构与软件架构师简单的说软件架构即是为客户构建一个软件系统.架构师随便软件架构应运而生,架构师是一个角色. 2000年9月ANSI和IEEE发布了<密集性软件架构建 ...

随机推荐

React项目 - 几种CSS实践
前言团队在使用react时,不断探索,使用了很多不同的css实现方式,此篇blog总结了,react项目中常见的几种css解决方案:inline-style/radium/style-componen ...
Elasticsearch7.X 入门学习第八课笔记-----索引模板和动态模板
原文:Elasticsearch7.X 入门学习第八课笔记-----索引模板和动态模板版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接: ...
EasyUI之DataGrid分页
第一步创建分页DataGrid <table id="dg"> <thead> <tr> <th data-options="f ...
CentOS安装Python3.x
安装python3.6可能使用的依赖# yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqli ...
python 中PIL.Image和OpenCV图像格式相互转换
PIL.Image转换成OpenCV格式: import cv2 from PIL import Image import numpy image = Image.open("plane ...
6-基于TMS320C6678、FPGA XC5VSX95T的6U CPCI 8路光纤信号处理卡
基于TMS320C6678.FPGA XC5VSX95T的6U CPCI 8路光纤信号处理卡 1.板卡概述本板卡由我公司自主研发,基于CPCI架构,符合CPCI2.0标准,采用两片TI DSP T ...
Memcache--02 源码安装nginx,php
目录一.session共享问题介绍二.环境准备一.session共享问题介绍 session主要用于服务端存储用户会话信息,cookie用于浏览器存储用户会话信息. 单系统服务session都存 ...
canvas一个简单粗暴的中奖转盘
最近在学canvas做动画,于是就写个转盘练下手.上个简陋的成果图(中间那个是转的指针,外面的圈是图片,懒得写了哈哈哈) 代码很简单,都注释了,直接上代码吧,嘤嘤嘤 html <body> ...
奇异值分解(SVD)(基础知识)
参考:https://www.cnblogs.com/pinard/p/6251584.html 参考:http://blog.csdn.net/u010099080/article/details/ ...
Java缓冲流高效大文件的复制实例
public class BufferedDemo { public static void main(String[] args) throws FileNotFoundException { // ...

pandas基础（第一章（一））

pandas基础（第一章（一））的更多相关文章

随机推荐

热门专题