10 Minutes to pandas

#Stats
# shift 这玩意儿有啥用???
s = pd.Series([1,5,np.nan], index=dates).shift(0)
# s1 = pd.Series([1,5,np.nan], index=dates).shift(1)
# s2 = pd.Series([1,5,np.nan], index=dates).shift(2)
# print(s)
# print(s1)
# print(s2)
# 2018-01-16 1.0
# 2018-01-17 5.0
# 2018-01-18 NaN
# Freq: D, dtype: float64
# 2018-01-16 NaN
# 2018-01-17 1.0
# 2018-01-18 5.0
# Freq: D, dtype: float64
# 2018-01-16 NaN
# 2018-01-17 NaN
# 2018-01-18 1.0
# Freq: D, dtype: float64 # print(df)
# print(df.sub(s, axis='index')) # "Wise subtraction"
# A B C D
# 2018-01-16 -1.809723 0.342129 2.048727 0.995959
# 2018-01-17 0.871955 1.960730 0.368855 0.459528
# 2018-01-18 -0.483717 0.031247 0.619609 -0.712104
# A B C D
# 2018-01-16 -2.809723 -0.657871 1.048727 -0.004041
# 2018-01-17 -4.128045 -3.039270 -4.631145 -4.540472
# 2018-01-18 NaN NaN NaN NaN

/

# Applying functions to the data
# print(df)
# print(df.apply(np.cumsum)) # 应用 numpy 的函数 cumsum 对每列累计求和
# A B C D
# 2018-01-16 1.516139 0.501701 0.624571 -1.270804
# 2018-01-17 -0.223673 -0.092153 0.782620 -2.073206
# 2018-01-18 0.844318 -1.180269 0.994821 -1.372318
# A B C D
# 2018-01-16 1.516139 0.501701 0.624571 -1.270804
# 2018-01-17 1.292466 0.409548 1.407191 -3.344010
# 2018-01-18 2.136784 -0.770721 2.402013 -4.716328

/

# Histogramming(直方图化) ps:就是把每个值出现的次数统计出来
# s = pd.Series(np.random.randint(0, 7, size=10))
# print(s)
# print(s.value_counts())
# 0 1
# 1 4
# 2 6
# 3 2
# 4 4
# 5 2
# 6 3
# 7 2
# 8 1
# 9 5
# dtype: int32
# 2 3
# 4 2
# 1 2
# 6 1
# 5 1
# 3 1
# dtype: int64

/

# String Methods
# s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan, 'CABA', 'dog', 'cat'])
# print(s.str.lower())
# 0 a
# 1 b
# 2 c
# 3 aaba
# 4 baca
# 5 NaN
# 6 caba
# 7 dog
# 8 cat
# dtype: object

Python笔记 #16# Pandas: Operations的更多相关文章

  1. Python笔记 #15# Pandas: Missing Data

    10 Minutes to pandas import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...

  2. Python笔记 #14# Pandas: Selection

    10 Minutes to pandas import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...

  3. Python笔记 #13# Pandas: Viewing Data

    感觉很详细:数据分析:pandas 基础 import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...

  4. Python笔记 #18# Pandas: Grouping

    10 Minutes to pandas 引 By “group by” we are referring to a process involving one or more of the foll ...

  5. Python笔记 #17# Pandas: Merge

    10 Minutes to pandas Concat df = pd.DataFrame(np.random.randn(10, 4)) print(df) # break it into piec ...

  6. python笔记16

    1.今日内容 模块基础知识 time/datetime json/picle shutil logging 其他 2.内容回顾和补充 2.1模块(类库) 内置 第三方 自定义 面试题: 列举常用内置模 ...

  7. 学习笔记之pandas

    Python Data Analysis Library — pandas: Python Data Analysis Library https://pandas.pydata.org/ panda ...

  8. 利用Python进行数据分析-Pandas(第一部分)

    利用Python进行数据分析-Pandas: 在Pandas库中最重要的两个数据类型,分别是Series和DataFrame.如下的内容主要围绕这两个方面展开叙述! 在进行数据分析时,我们知道有两个基 ...

  9. 【Python实战】Pandas:让你像写SQL一样做数据分析(一)

    1. 引言 Pandas是一个开源的Python数据分析库.Pandas把结构化数据分为了三类: Series,1维序列,可视作为没有column名的.只有一个column的DataFrame: Da ...

随机推荐

  1. Android 在界面中显示以及输入文本信息 TextView和EditText

    Android控件之TextView和EditTextTextView:显示文本框控件EditText:输入文本框TextView和EditText的常用属性TextView控件的常用属性androi ...

  2. saltstack远程执行命令.md

    saltstack 支持在master上向client 远程执行命令,并显示命令执行的结果 命令格式: salt '<操作目标>' <方法> [参数] 示例 示例1 ping检 ...

  3. 【IOS6.0 自学瞎折腾】(五)应用程序的启动过程和Application生命周期

    一 :main函数入口 看下项目资源结构,其实程序的入口也是在main.m里面. #import <UIKit/UIKit.h> #import "BvinAppDelegate ...

  4. java基础---->多线程之Runnable(一)

    java线程的创建有两种方式,这里我们通过简单的实例来学习一下.一切都明明白白,但我们仍匆匆错过,因为你相信命运,因为我怀疑生活. java中多线程的创建 一.通过继承Thread类来创建多线程 pu ...

  5. C++中的三种继承public,protected,private

    ( c++默认class是private继承且class内的成员默认都是private struct 默认位public 继承,struct内成员默认是public  ) 三种访问权限 public: ...

  6. maven项目使用SOLR时报 previously initiated loading for a different type with name "javax/servlet/http/HttpServletRequest" 错的解决方法

    环境:Apache solr4.8,maven3,IntellijIDEA 想在项目中使用solr 在pom.xml文件中添加了solr的依赖 solr-core,solrj 和solr-dataim ...

  7. 【office2010】office2010安装问题的解决方案。

    今天想在公司电脑上按上一个office2010,结果出现一个问题,导致研究了一下午才解决:现总结解决方案: 安装office 2010,提示需要安装MSXML版本6.10.1129.0组件.但是在网上 ...

  8. 170607、SQL Select语句完整的执行顺序

    SQL Select语句完整的执行顺序: 1.from子句组装来自不同数据源的数据: 2.where子句基于指定的条件对记录行进行筛选: 3.group by子句将数据划分为多个分组: 4.使用聚集函 ...

  9. c# 读取confgi文件

    引用命名空间using System.Configuration; Winform—C#读写config配置文件

  10. Oracle安装部署之 timesten install on redhat6.5

    一.安装前检查 [root@localhost ~]# cat /etc/redhat-release Red Hat Enterprise Linux Server release 6.5 (San ...