[Python] Normalize the data with Pandas

import os

import pandas as pd

import matplotlib.pyplot as plt

def test_run():

    start_date='2017-01-01'

    end_data='2017-12-15'

    dates=pd.date_range(start_date, end_data)

    # Create an empty data frame

    df=pd.DataFrame(index=dates)

    symbols=['SPY', 'AAPL', 'IBM', 'GOOG', 'GLD']

    for symbol in symbols:

        temp=getAdjCloseForSymbol(symbol)

        df=df.join(temp, how='inner')

    return df   

def normalize_data(df):

    """ Normalize stock prices using the first row of the dataframe """

    df=df/df.ix[0, :]

    return df

def getAdjCloseForSymbol(symbol):

    # Load csv file

    temp=pd.read_csv("data/{0}.csv".format(symbol),

        index_col="Date",

        parse_dates=True,

        usecols=['Date', 'Adj Close'],

        na_values=['nan'])

    # rename the column

    temp=temp.rename(columns={'Adj Close': symbol})

    return temp

def plot_data(df, title="Stock prices"):

    ax=df.plot(title=title, fontsize=10)

    ax.set_xlabel("Date")

    ax.set_ylabel("Price")

    plt.show()

if __name__ == '__main__':

    df=test_run()

    # data=data.ix['2017-12-01':'2017-12-15', ['IBM', 'GOOG']]

    df=normalize_data(df)

    plot_data(df)

    """

                       IBM         GOOG

    2017-12-01  154.759995  1010.169983

    2017-12-04  156.460007   998.679993

    2017-12-05  155.350006  1005.150024

    2017-12-06  154.100006  1018.380005

    2017-12-07  153.570007  1030.930054

    2017-12-08  154.809998  1037.050049

    2017-12-11  155.410004  1041.099976

    2017-12-12  156.740005  1040.479980

    2017-12-13  153.910004  1040.609985

    2017-12-15  152.500000  1064.189941

    """

It is easy to compare the data by normalize it.

[Python] Normalize the data with Pandas的更多相关文章

[Python] Slice the data with pandas
For example we have dataframe like this: SPY AAPL IBM GOOG GLD 2017-01-03 222.073914 114.311760 160. ...
一句Python，一句R︱pandas模块——高级版data.frame
先学了R,最近刚刚上手python,所以想着将python和R结合起来互相对比来更好理解python.最好就是一句python,对应写一句R. pandas可谓如雷贯耳,数据处理神器. 以下符号: = ...
Seven Python Tools All Data Scientists Should Know How to Use
Seven Python Tools All Data Scientists Should Know How to Use If you’re an aspiring data scientist, ...
arcgis python arcpy add data script添加数据脚本
arcgis python arcpy add data script添加数据脚本mxd = arcpy.mapping.MapDocument("CURRENT")... df ...
[Machine Learning with Python] My First Data Preprocessing Pipeline with Titanic Dataset
The Dataset was acquired from https://www.kaggle.com/c/titanic For data preprocessing, I firstly def ...
Python数据科学安装Numby,pandas,scipy,matpotlib等（IPython安装pandas）
Python数据科学安装Numby,pandas,scipy,matpotlib等(IPython安装pandas) 如果还没有本地安装Python.IPython.notebook等请移步上篇Py ...
用pandas进行数据清洗（二）（Data Analysis Pandas Data Munging/Wrangling）
在<用pandas进行数据清洗(一)(Data Analysis Pandas Data Munging/Wrangling)>中,我们介绍了数据清洗经常用到的一些pandas命令. 接下 ...
Python For Data Analysis -- Pandas
首先pandas的作者就是这本书的作者对于Numpy,我们处理的对象是矩阵 pandas是基于numpy进行封装的,pandas的处理对象是二维表(tabular, spreadsheet-like ...
Python 数据处理扩展包： pandas 模块的DataFrame介绍（创建和基本操作）
DataFrame是Pandas中的一个表结构的数据结构,包括三部分信息,表头(列的名称),表的内容(二维矩阵),索引(每行一个唯一的标记). 一.DataFrame的创建有多种方式可以创建Data ...

随机推荐

Session与Token认证机制前后端分离下如何登录
字号 1 Web登录涉及到知识点 1.1 HTTP无状态性 HTTP是无状态的,一次请求结束,连接断开,下次服务器再收到请求,它就不知道这个请求是哪个用户发过来的.当然它知道是哪个客户端地址发过来的 ...
NodeJS学习笔记 (5)网络服务-http-req(ok)
原文:https://github.com/chyingp/nodejs-learning-guide 自己敲代码: 概览本文的重点会放在req这个对象上.前面已经提到,它其实是http.Incom ...
HDU-1215 七夕节数论唯一分解定理求约数之和
题目链接:https://cn.vjudge.net/problem/HDU-1215 题意中文题,自己去看吧,懒得写:) 思路 \[ Ans=\prod \sum p_i^j \] 唯一分解定理 ...
ActiveMQ客户端配置使用
一.通过JNDI来使用ActiveMQ 1.jndi配置JMS对象 java.naming.factory.initial = org.apache.activemq.jndi.ActiveMQIni ...
制作PC端的安装程序
一个多月不写博客了,不造大家有没有想我,(别自恋了,寥寥无几的粉丝,谁会想你),呜呜~~~ 好了,废话少叙,借用郭德纲老板的话,天儿不早了,干点正事儿吧! 一.序 Unity开发者都知道,打包出来的e ...
【BZOJ 1257】[CQOI2007]余数之和
[链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] k%i=k-(k/i)i 则∑k%i = nk-∑(k/i)*i 因为k/i是整除运算. 所以会有某一段连续的i,它们的k/i的值都 ...
配置oh-my-zsh
1. 当使用zsh进入庞大的git工程目录下时,会发生cd命令很慢的情况可以把~/.oh-my-zsh/lib/git.zsh里面的git_prompt_info函数替换为 function git ...
ubuntu下安装宋体simsun
sudo cp simsun.ttc /usr/share/fonts cd /usr/share/fontssudo chmod 644 simsun.ttc 更新字体缓存: 代码: sudo m ...
SLF4j 和 common-logging
http://blog.csdn.net/xydds/article/details/51606010
洛谷——P2661 信息传递
https://www.luogu.org/problem/show?pid=2661#sub 题目描述有n个同学(编号为1到n)正在玩一个信息传递的游戏.在游戏里每人都有一个固定的信息传递对象,其 ...

[Python] Normalize the data with Pandas

[Python] Normalize the data with Pandas的更多相关文章

随机推荐

热门专题