该系列视频已经搬运至bilibili: 点击查看

欢迎来到Python for Finance教程系列的第4部分。在本教程中,我们将基于Adj Close列创建烛台/ OHLC图,这将允许我介绍重新采样和其他一些数据可视化概念。

名为烛台图的OHLC图表是一种将开盘价Open,最高价High,最低价Low和收盘价Close数据全部集中在一个很好的格式中的图表。另外,它使得漂亮的颜色,并记住我告诉你关于美观的图表?

在之前的教程中已经涉及到了这一点:

import datetime as dt
import matplotlib.pyplot as plt
from matplotlib import style
import pandas as pd
import pandas_datareader.data as web
style.use('ggplot') df = pd.read_csv('tsla.csv', parse_dates=True, index_col=0)

不幸的是,即使创建OHLC数据,直接从Pandas制作烛台图也不是内置的。未来我确信这个图表类型将会被提供,但现在不是。没关系,we can make it!首先,我们需要import两个新的库:

from matplotlib.finance import candlestick_ohlc
import matplotlib.dates as mdates

第一个导入是来自matplotlib的OHLC图形类型,第二个导入是特殊的mdates类型,它大多只是一个屁股疼痛,但这是matplotlib图形的日期类型。pandas会自动为你处理,但就像我说的那样,我们没有烛台的奢侈品。

首先,我们需要适当的OHLC数据。我们目前的数据确实有OHLC的价值,除非我错了,特斯拉从来没有分裂过,但是你永远不会这么幸运。因此,我们将创建我们自己的OHLC数据,这也将允许我们展示另一个来自Pandas的数据转换:

df_ohlc = df['Adj Close'].resample('10D').ohlc()

我们在这里所做的是创建一个基于df ['Adj Close']列的新数据框,重新封装10天的窗口,并且重采样是一个ohlc(开高低关闭)。我们也可以用.mean()或.sum()做10天的平均值或10天的总和。请记住,这10天的平均值是10天的平均值,而不是平均值。由于我们的数据是每日数据,因此将其重新采样为10天的数据会显着缩小数据的大小。这是你可以如何规范化多个数据集。有时,您可能会在每个月的一个月中记录一次每月记录的数据,每个月末记录的其他数据,以及最终每周记录一些数据。您可以每个月对该数据帧重新采样到月末,并有效地将其标准化!如果你喜欢的话,这是更高级的熊猫功能,你可以从熊猫系列中了解更多。

我们想要绘制烛台数据以及体积数据。我们不必重新采样数据,但我们应该,因为它与我们的10D定价数据相比太细致。

df_volume = df['Volume'].resample('10D').sum()

我们在这里使用金额,因为我们确实想知道在这10天内交易的总量,但您也可以使用平均值。现在如果我们这样做:

print(df_ohlc.head())

我们得到:

                 open       high        low      close
Date
2010-06-29 23.889999 23.889999 15.800000 17.459999
2010-07-09 17.400000 20.639999 17.049999 20.639999
2010-07-19 21.910000 21.910000 20.219999 20.719999
2010-07-29 20.350000 21.950001 19.590000 19.590000
2010-08-08 19.600000 19.600000 17.600000 19.150000

这是预期的,但是,我们现在要将这些信息移动到matplotlib中,并将日期转换为mdates版本。由于我们只是要在Matplotlib中绘制列,所以我们实际上不希望日期成为索引,所以我们可以这样做:

df_ohlc = df_ohlc.reset_index()

现在的日期只是一个普通的专栏。接下来,我们要转换它:

df_ohlc ['Date'] = df_ohlc ['Date']。map(mdates.date2num)

现在我们要设置这个数字:

fig = plt.figure()
ax1 = plt.subplot2grid((6,1),(0,0),rowspan = 5,colspan = 1)
ax2 = plt.subplot2grid((6,1),(5,0),rowspan = 1,colspan = 1,sharex = ax1)
ax1.xaxis_date()

除了ax1.xaxis_date()之外,您已经看到过的所有内容。这对我们来说就是将轴从原始的生成号码转换为日期。

现在我们可以绘制烛台图:

candlestick_ohlc(ax1,df_ohlc.values,width = 2,colorup ='g')

然后做量:

ax2.fill_between(df_volume.index.map(mdates.date2num),df_volume.values,0)

fill_between函数将绘制x,y,然后填充/之间的内容。在我们的例子中,我们选择0。

plt.show()

完整代码:

import datetime as dt
import matplotlib.pyplot as plt
from matplotlib import style
from matplotlib.finance import candlestick_ohlc
import matplotlib.dates as mdates
import pandas as pd
import pandas_datareader.data as web
style.use('ggplot') df = pd.read_csv('tsla.csv', parse_dates=True, index_col=0) df_ohlc = df['Adj Close'].resample('10D').ohlc()
df_volume = df['Volume'].resample('10D').sum() df_ohlc.reset_index(inplace=True)
df_ohlc['Date'] = df_ohlc['Date'].map(mdates.date2num) ax1 = plt.subplot2grid((6,1), (0,0), rowspan=5, colspan=1)
ax2 = plt.subplot2grid((6,1), (5,0), rowspan=1, colspan=1, sharex=ax1)
ax1.xaxis_date() candlestick_ohlc(ax1, df_ohlc.values, width=5, colorup='g')
ax2.fill_between(df_volume.index.map(mdates.date2num), df_volume.values, 0)
plt.show()

在接下来的几个教程中,我们将留下可视化位,稍微讨论一下获取数据和处理数据。

下一篇教程:Python股票分析系列——自动获取标普500股票列表.p5

Python股票分析系列——基础股票数据操作(二).p4的更多相关文章

  1. Python股票分析系列——基础股票数据操作(一).p3

    该系列视频已经搬运至bilibili: 点击查看 欢迎来到Python for Finance教程系列的第3部分.在本教程中,我们将使用我们的股票数据进一步分解一些基本的数据操作和可视化.我们将要使用 ...

  2. Python股票分析系列——数据整理和绘制.p2

    该系列视频已经搬运至bilibili: 点击查看 欢迎来到Python for Finance教程系列的第2部分. 在本教程中,我们将利用我们的股票数据进一步分解一些基本的数据操作和可视化. 我们将要 ...

  3. Python股票分析系列——系列介绍和获取股票数据.p1

    本系列转载自youtuber sentdex博主的教程视频内容 https://www.youtube.com/watch?v=19yyasfGLhk&index=4&list=PLQ ...

  4. python量化分析系列之---5行代码实现1秒内获取一次所有股票的实时分笔数据

    python量化分析系列之---5行代码实现1秒内获取一次所有股票的实时分笔数据 最近工作太忙了,有一个星期没有更新文章了,本来这一期打算分享一些对龙虎榜数据的分析结果的,现在还没有把数据内的价值很好 ...

  5. Python股票分析系列——自动获取标普500股票列表.p5

    该系列视频已经搬运至bilibili: 点击查看 欢迎来到Python for Finance教程系列的第5部分.在本教程和接下来的几节中,我们将着手研究如何为更多公司提供大量的定价信息,以及如何一次 ...

  6. GIS基础软件及操作(二)

    原文 GIS基础软件及操作(二) 练习二.管理地理空间数据库 1.利用ArcCatalog 管理地理空间数据库 2.在ArcMap中编辑属性数据 第1步 启动 ArcCatalog 打开一个地理数据库 ...

  7. SQLite基础-5.数据操作语言

    目录 一.添加数据(insert) 二.查询数据(select) 三.更新数据(update) 三. 删除数据(delete) 一.添加数据(insert) INSERT INTO 用于向数据库的某个 ...

  8. 《手把手教你》系列基础篇(九十二)-java+ selenium自动化测试-框架设计基础-POM设计模式简介(详解教程)

    1.简介 页面对象模型(Page Object Model)在Selenium Webdriver自动化测试中使用非常流行和受欢迎,作为自动化测试工程师应该至少听说过POM这个概念.本篇介绍POM的简 ...

  9. 使用Hive或Impala执行SQL语句,对存储在Elasticsearch中的数据操作(二)

    CSSDesk body { background-color: #2574b0; } /*! zybuluo */ article,aside,details,figcaption,figure,f ...

随机推荐

  1. Tmux 日常快捷键 及配置

    使用Linux的人不管是开发人员.还是运维人员都不可避免的需要使用到终端模拟器(比如,gnome-terminal)去执行一些命令或者脚本. tmux可以将终端模拟器方便的切分为不同的小窗口如下图如示 ...

  2. Orchard详解--第八篇 拓展模块及引用的预处理

    从上一篇可以看出Orchard在处理拓展模块时主要有两个组件,一个是Folder另一个是Loader,前者用于搜索后者用于加载. 其中Folder一共有三个:Module Folder.Core Fo ...

  3. mysql服务自启【Linux】

    1.复制启动脚本到资源目录 2.增加mysqld服务控制脚本执行权限 3.mysql服务添加到系统服务 4.检测mysqld服务是否生效 表明服务已经启动,以后可以使用service命令启动mysql ...

  4. Java的sql动态参数

    在C#的方法中可以使用params Parameter[] values来动态获取sql语句中的参数值数组.Java中可以自己封装出一个类似于C#的方法 1.获取结果集 /** * 获取结果集 * @ ...

  5. 上传github文件及所出现的问题

    上传github所发现的问题 准备工作 使用 git bush 输入下面的命令 git config --global user.email "you@example.com" g ...

  6. centOS7docker安装oracle

    1.拉取oracle 11g 的镜像: 用root登陆服务器,输入下面的命令,拉取oracle 11g的镜像,有点大,6.8G多: docker pull registry.cn-hangzhou.a ...

  7. [Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作

    0. 说明 serde 是序列化和反序列化 serialize & deserialize 是将文件中的字段映射成 Hive 中的列 1. 验证 1.1 openCSVSerde CSV 为逗 ...

  8. Dos环境变量修改

    批处理修改环境变量,修改用户变量.系统变量(全局变量),永久/临时设置环境变量.设置Java环境变量 临时环境变量 修改变量: set PATH=%Path%;%JAVA_HOME%\bin 含义:表 ...

  9. Ajax入门例子

    在customer.php的文件中,代码如下: <html> <head> <script type="text/javascript"> fu ...

  10. shell 获取时间

    获取当前时间 t=$(date +"%Y-%m-%d %H-%M-%S") echo $t 获取前一天的当前时间 time=$(date -d "-1 day" ...