[Python] Pandas load DataFrames

Create an empty Data frame with date index:

import pandas as pd

def test_run():

    start_date='2017-11-24'

    end_data='2017-11-28'

    dates=pd.date_range(start_date, end_data)

    df1=pd.DataFrame(index=dates)

    print(df1)

"""

Empty DataFrame

Columns: []

Index: [2010-01-22 00:00:00, 2010-01-23 00:00:00, 2010-01-24 00:00:00, 2010-01-25 00:00:00, 2010-01-26 00:00:00]

"""

Now we want to load SPY.csv and get 'Adj Close' column value and copy the range (11-21, 11-28) data to the empty data frame:

import pandas as pd

def test_run():

    start_date='2017-11-24'

    end_data='2017-11-28'

    dates=pd.date_range(start_date, end_data)

    # Create an empty data frame

    df1=pd.DataFrame(index=dates)

    # Load csv file

    dspy=pd.read_csv('data/SPY.csv',

    index_col="Date",

    parse_dates=True,

    usecols=['Date', 'Adj Close'],

    na_values=['nan'])

    # print(dspy)

    """

             Adj Close

    Date

    2017-11-16  258.619995

    2017-11-17  257.859985

    2017-11-20  258.299988

    """

    # join the table

    df1=df1.join(dspy)

    #print(df1)

    """

                 Adj Close

    2017-11-24  260.359985

    2017-11-25         NaN

    2017-11-26         NaN

    2017-11-27  260.230011

    """

    # drop the nan row

    df1=df1.dropna()

    print(df1)

    """

                 Adj Close

    2017-11-24  260.359985

    2017-11-27  260.230011

    2017-11-28  262.869995

    """

if __name__ == '__main__':

    test_run()

There is a simpy way to drop the data which index is not present in dspy:

df1=df1.join(dspy, how='inner')

We can also rename the 'Adj Close' to prevent conflicts:

    # rename the column

    dspy=dspy.rename(columns={'Adj Close': 'SPY'})

Load more stocks:

import pandas as pd

def test_run():

    start_date='2017-11-24'

    end_data='2017-11-28'

    dates=pd.date_range(start_date, end_data)

    # Create an empty data frame

    df1=pd.DataFrame(index=dates)

    # Load csv file

    dspy=pd.read_csv('data/spy.csv',

    index_col="Date",

    parse_dates=True,

    usecols=['Date', 'Adj Close'],

    na_values=['nan'])

    # print(dspy)

    """

             Adj Close

    Date

    2017-11-16  258.619995

    2017-11-17  257.859985

    2017-11-20  258.299988

    """

    # rename the column

    dspy=dspy.rename(columns={'Adj Close': 'spy'})

    # join the table

    df1=df1.join(dspy, how='inner')

    # print(df1)

    """

                 Adj Close

    2017-11-24  260.359985

    2017-11-27  260.230011

    2017-11-28  262.869995

    """

    symbols=['aapl', 'ibm']

    for symbol in symbols:

        temp=pd.read_csv('data/{0}.csv'.format(symbol), index_col="Date", parse_dates=True, usecols=['Date', 'Adj Close'], na_values=['nan'])

        temp=temp.rename(columns={'Adj Close': symbol})

        df1=df1.join(temp)

    print(df1)

    """

                       spy        aapl         ibm

    2017-11-24  260.359985  174.970001  151.839996

    2017-11-27  260.230011  174.089996  151.979996

    2017-11-28  262.869995  173.070007  152.470001

    """

if __name__ == '__main__':

    test_run()

[Python] Pandas load DataFrames的更多相关文章

python & pandas链接mysql数据库
Python&pandas与mysql连接 1.python 与mysql 连接及操作,直接上代码,简单直接高效: import MySQLdb try: conn = MySQLdb.con ...
Python pandas ERROR 2006 (HY000): MySQL server has gone away
之前在做python pandas大数据分析的时候,在将分析后的数据存入mysql的时候报ERROR 2006 (HY000): MySQL server has gone away 原因分析:在对百 ...
Python+Pandas 读取Oracle数据库
Python+Pandas 读取Oracle数据库 import pandas as pd from sqlalchemy import create_engine import cx_Oracle ...
看到篇博文，用python pandas改写了下
看到篇博文,https://blog.csdn.net/young2415/article/details/82795688 需求是需要统计部门礼品数量,自己简单绘制了个表格,如下: 大意是,每个部门 ...
Python pandas快速入门
Python pandas快速入门2017年03月14日 17:17:52 青盏阅读数:14292 标签: python numpy 数据分析更多个人分类: machine learning 来 ...
Python pandas & numpy 笔记
记性不好,多记录些常用的东西,真·持续更新中::先列出一些常用的网址: 参考了的莫烦python pandas DOC numpy DOC matplotlib 常用习惯上我们如此导入: impo ...
python. pandas(series,dataframe,index) method test
python. pandas(series,dataframe,index,reindex,csv file read and write) method test import pandas as ...
oracle数据据 Python+Pandas 获取Oracle数据库并加入DataFrame
import pandas as pd import sys import imp imp.reload(sys) from sqlalchemy import create_engine impor ...
Python Pandas找到缺失值的位置
python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数据缺失,一共有多少个缺失数据,缺 ...

随机推荐

ActiveMQ学习笔记（8）----ActiveMQ的消息存储持久化
1. 概述 ActiveMQ不仅支持persistent和non-persistent两种方式,还支持消息的恢复(recovery)方式. 2. PTP Queue的存储是很简单的,其实就是FIFO的 ...
Ueditor富编辑器
坑多的Ueditor富编辑器第一步:修改serverUrl: window.BASEPATH + "notice/word" 第二部:添加依赖包 <dependency&g ...
How Javascript works (Javascript工作原理) (三) 内存管理及如何处理 4 类常见的内存泄漏问题
个人总结: 1.两种垃圾回收机制: 1)引用标记算法:如果检测到一个对象没有被引用了,就清除它. ***这种算法不能处理循环引用的情况*** 2)标记—清除算法:从根(全局变量)开始向后代变量检测,任 ...
LightOJ-1220 Mysterious Bacteria 唯一分解定理带条件的最大公因数
题目链接:https://cn.vjudge.net/problem/LightOJ-1220 题意给x=y^p,问p最大多少注意x可能负数思路唯一分解定理,求各素因数指数的GCD 注意负数的 ...
[terry笔记]data guard基础知识
如下介绍了data guard的基础知识,整理自网络: Data Gurad 通过冗余数据来提供数据保护,Data Gurad 通过日志同步机制保证冗余数据和主数据之前的同步,这种同步可以是实时,延时 ...
Qt之字典划词
简述相信大家都用过词典吧!因为英语不太好...O(∩_∩)O~,所以经常进行划词翻译! 简述实现效果源码更多参考实现原理:鼠标移至某单词之上,获取鼠标位置,然后在对应位置进行取词,翻译! ...
E-UTRA channel bandwidths per operating band (36.101)
E-UTRA channel bandwidths per operating band (36.101) watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/ ...
50个Android开发技巧(09 避免用EditText对日期进行验证)
我们都知道,在表单中对数据进行验证不但无聊并且easy出错. (原文地址:http://blog.csdn.net/vector_yi/article/details/24424713) 想象一下,一 ...
mac鼠标滚动方向自然问题
mac使用鼠标的时候滚轮方向和Windows是相反的.假设不勾选滚动方向自然,那么触摸板使用不爽. 解决的方法: 1.打开http://pilotmoon.com/scrollreverser/,下载 ...
HP-lefthand底层结构具体解释及存储灾难数据恢复
HP-lefthand底层结构具体解释及存储灾难数据恢复一.HP-lefthand的特点 HP-lefhand是一款很不错的SAN存储,使用iscsi协议为client分配空间. 它支持RAID5. ...

[Python] Pandas load DataFrames

[Python] Pandas load DataFrames的更多相关文章

随机推荐

热门专题