python数据分析panda库

panda内有两种数据结构，Series（）和DataFrame（）

 >>> a=pd.Series([1,2],index=['a','b'])

 >>> a

 a    1

 b    2

 dtype: int64

 >>> b.index

 RangeIndex(start=0, stop=2, step=1)

 >>> b.values

 array(['b', 'a'], dtype=object)

 >>> a/2

 a    0.5

 b    1.0

 dtype: float64

 >>>

列表切分选择

>>> s[0:3:2]

a    2

c    6

dtype: int64

  s3=pd.Series(arr)  另一种方式生成series

 >>> s3

 0    1

 1    2

 2    3

 3    4

 dtype: int32

 >>> s3=pd.Series(s)

 >>> s3

 a    2

 b    5

 c    6

 d    3

 dtype: int64

 >>> s[s>8]

 Series([], dtype: int64)

 >>> s

 a    2

 b    5

 c    6

 d    3

 dtype: int64

 >>> s[s>3]    找出>3的元素

 b    5

 c    6

 dtype: int64

 >>> np.log(s)    对series直接运用函数

 a    0.693147

 b    1.609438

 c    1.791759

 d    1.098612

 dtype: float64

 >>> s.isin([5,6])     看某些元素是否在series中，boolean值

 a    False

 b     True

 c     True

 d    False

 dtype: bool

 >>> s[s.isin([5,6])]

 b    5

 c    6

 dtype: int64

 >>> s2=pd.Series([5,2,np.NaN,7,np.NaN])

 >>> s2

 0    5.0

 1    2.0

 2    NaN

 3    7.0

 4    NaN

 dtype: float64

 >>> s2.isnull()

 0    False

 1    False

 2     True

 3    False

 4     True

 dtype: bool

 >>> s2.notnull()

 0     True

 1     True

 2    False

 3     True

 4    False

 dtype: bool

>>> s2[s2.isnull()]

2   NaN

4   NaN

dtype: float64

Frame的使用

 frame2=pd.DataFrame(fram,columns=['name','age'])

 >>> frame2

         name  age

 red        1    2

 yellow     5    6

 blue       9   10

 black     13   14

 >>> frame2.values

 array([[ 1,  2],

        [ 5,  6],

        [ 9, 10],

        [13, 14]])

 >>> frame2.index

 Index([u'red', u'yellow', u'blue', u'black'], dtype='object')

 >>> frame2.columns

 Index([u'name', u'age'], dtype='object')

 >>> frame2['name']

 red        1

 yellow     5

 blue       9

 black     13

 Name: name, dtype: int32

 >>> frame2.name

 red        1

 yellow     5

 blue       9

 black     13

 Name: name, dtype: int32

 >>> frame2.age

 red        2

 yellow     6

 blue      10

 black     14

 Name: age, dtype: int32

 >>> frame2[index=['red']]

>>> frame2[0:2]

        name  age

red        1    2

yellow     5    6

>>> frame2['name'][2]

9

 >>> s.idxmin()

 'a'

 >>> s.idxmax9)

 SyntaxError: invalid syntax

 >>> s.idxmax()

 'c'

 >>> s.index.is_unique

 True

>>> fram

        id  name  age  home

red      0     1    2     3

yellow   4     5    6     7

blue     8     9   10    11

black   12    13   14    15

>>> frame4=fram.drop(['name','age'],axis=1)   删除列

>>> frame4

        id  home

red      0     3

yellow   4     7

blue     8    11

black   12    15

 >>> f=lambda x:x.max()-x.min()   对frame运用自定义函数

 >>> fram.apply(f)

 id      12

 name    12

 age     12

 home    12

 dtype: int64

 >>> fram.apply(f,axis=1)

 red       3

 yellow    3

 blue      3

 black     3

 dtype: int64

 >>> fram.apply(f,axis=0)

 id      12

 name    12

 age     12

 home    12

 dtype: int64

 >>> def f(x):

     return pd.Series([x.min(),x.max()],index=['min','max'])

 >>> fram.apply(f)

      id  name  age  home

 min   0     1    2     3

 max  12    13   14    15

　　frame的一些数学统计值

 >>> fram.describe()

               id       name        age       home

 count   4.000000   4.000000   4.000000   4.000000

 mean    6.000000   7.000000   8.000000   9.000000

 std     5.163978   5.163978   5.163978   5.163978

 min     0.000000   1.000000   2.000000   3.000000

 25%     3.000000   4.000000   5.000000   6.000000

 50%     6.000000   7.000000   8.000000   9.000000

 75%     9.000000  10.000000  11.000000  12.000000

 max    12.000000  13.000000  14.000000  15.000000

 >>> fram.sum()

 id      24

 name    28

 age     32

 home    36

 dtype: int64

 >>> fram.mean()

 id      6.0

 name    7.0

 age     8.0

 home    9.0

 dtype: float64

 >>> fram.min()

 id      0

 name    1

 age     2

 home    3

 dtype: int32

python数据分析panda库的更多相关文章

Python数据分析numpy库
1.简介 Numpy库是进行数据分析的基础库,panda库就是基于Numpy库的,在计算多维数组与大型数组方面使用最广,还提供多个函数操作起来效率也高 2.Numpy库的安装 linux(Ubuntu ...
Python数据分析扩展库
Anaconda和Python(x,y)都自带了下面的这些库. 1. NumPy 强大的ndarray和ufunc函数. import numpy as np xArray = np.ones((3, ...
Python数据分析Pandas库方法简介
Pandas 入门 Pandas简介背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...
Python数据分析工具库-Numpy 数组支持库（一）
1 Numpy数组在Python中有类似数组功能的数据结构,比如list,但在数据量大时,list的运行速度便不尽如意,Numpy(Numerical Python)提供了真正的数组功能,以及对数据 ...
Python数据分析Numpy库方法简介(二)
数据分析图片保存:vg 1.保存图片:plt.savefig(path) 2.图片格式:jpg,png,svg(建议使用,不失真) 3.数据存储格式: excle,csv csv介绍 csv就是用逗号 ...
利用python数据分析panda学习笔记之Series
1 Series a:类似一维数组的对象,每一个数据与之相关的数据标签组成 b:生成的左边为索引,不指定则默认从0开始. from pandas import Series,DataFrame imp ...
Python数据分析Pandas库之熊猫(10分钟二)
pandas 10分钟教程(二) 重点发法分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...
Python数据分析Pandas库之熊猫(10分钟一)
pandas熊猫10分钟教程排序 df.sort_index(axis=0/1,ascending=False/True) df.sort_values(by='列名') import numpy ...
Python数据分析Pandas库数据结构(一)
pandas数据结构 1.生成一维矩阵模拟数据 import pandas as pdimport numpy as nps = pd.Series([1,2,3,4,np.nan,9,9])s2 = ...

随机推荐

PHP支持的协议和封装的协议
今天主要看了下PHP支持的协议和封装的协议,主要了解了一下PHP中的配置协议方面的东西,弄明白了以前比较模糊的stream_context_create()等上下文方法,还没有完全看完,先将自己的片段 ...
Mvc数据验证总结
Mvc提供模型级数据验证一.服务端验证: ModelState.IsValid ModelState.AddModelError("Name", "错误提示" ...
Framework7
完美的HTML框架可以构建精美的iOS & Android 应用
80C51学习流水灯
/* c语言常用预处理命令 1.#define使用 #define A PO 后面不用加分号. #define PI 3.14 2.循环左移右移函数 _crol_(a,b)循环左移函数,a是左移的值, ...
Shrio授权验证详解
所谓授权,就是控制你是否能访问某个资源,比如说,你可以方位page文件夹下的jsp页面,但是不可以访问page文件夹下的admin文件夹下的jsp页面. 在授权中,有三个核心元素:权限,角色,用户. ...
Maven详解（六）------ 生命周期
1.什么是生命周期? Maven 强大的原因是有一个十分完善的生命周期,生命周期可以理解为项目构建步骤的集合,它定义了各个构建环节的执行顺序,有了这个顺序,Maven 就可以自动化的执行构建命令. ...
Nexus私服搭建使用及发布jar包到私服上供团队其他成员使用
1.下载maven解压到指定目录,并配置环境变量 M2_HOME为maven解压目录 2.path中增加 %M2_HOME%\bin, 并确认 mvn -v 正确 3.下载nexus http://w ...
jquery的2.0.3版本源码系列(3):96行-283行，给JQ对象，添加一些方法和属性
jquery是面向对象的程序,面向对象就离不开方法和属性. 方法的简化 jQuery.fn=jQuery.prototype={ jquery: 版本 constructor: 修正指向问题 init ...
App测试中 ----------------Android和IOS测试区别
1 . Android长按home键呼出应用列表和切换应用,然后右滑则终止应用:2. 多分辨率测试,Android端20多种,ios较少:3. 手机操作系统,Android较多,ios较少且不能降级, ...
maven 随笔
<build> <plugins>  <plugin> <artifactId>maven-source-plugi ...

python数据分析panda库

python数据分析panda库的更多相关文章

随机推荐

热门专题