作者:李洪成

摘自:http://cos.name/wp-content/uploads/2013/11/ChinaR2013SH_Nov03_04_LiHongcheng.pdf

高频数据

  • 金融市场中,逐笔交易数据(transaction by transaction data) 或逐秒记录数据 (tick by tick data) 被称为高频数据。纽约股票交易所的交易行情数据库包含了综合磁带系统报告的所有证券的交易和报价记录(Trades and Quotes- NYSE TAQ), 另外WRDS TAQ, Reuters, Bloomberg等。

高频数据的特点

  • 数据量大:一只股票一天中可以有几百万条交易
  • 交易间的时间间隔是不规则的,不是等间隔
  • 保存的数据由于多种原因会包含错误
    • 不正确的交易量
    • 失时效的价格
    • 一秒钟的多重交易
    • 不准确的时间 (innaccurate times)
某股票2010年10月4日到10月15日
相邻两个交易的价格变动频率
 
高频金融数据用于研究与交易过程和市场微观结构相关的大量问题
  • 股票买卖报价的动态性
  • 市场的流动性
  • 算法交易
  • 收益的实际波动率

Data Structure of Trade data

  • PRICE 交易价格
  • SIZE 交易股数
  • COND: 交易条件代码
  • CORR: 修改标识, 交易为正常即没有经 过校正、修改或者被标记为取消
  • G127 Combined "G", Rule 127, and stopped stock trade

Data Structure of Quote data

  • BID:卖价
  • BIDSIZ:卖出量,以100股为单位
  • OFR:买价
  • OFRSIZ:买入量
  • MODE:报价条件标识

R的高频数据分析包

  • R中针对高频数据的添加包:highfrequency
  • 该包最新版本为0.2,基于R 2.12.0或者更高 版本,依赖于 xts, zoo两个包。
  • highfrequency是另外两个已有R包的更新版 - 两个都被移除了

    • RTAQ (Cornelissen and Boudt 2012 ) TradeAnalytics project
    • realized (Payseur 2008)

Highfrequency主要功能

  • 组织高频数据
  • 高频数据的清理、整理
  • 高频数据的汇总
  • 高频数据的相关模型:
    • 波动率模型
    • 流动性

三类高频数据

  • NYSE TAQ数据库中的 .txt文件
  • WRDS数据库中的 .csv文件
  • Tickdata.com的.asc文件
  • 函数convert()可以把上述三类数据转换为xts对象
convert(
  from,
  to,
  datasource,
  datadestination,
  trades=TRUE,
  quotes=FALSE,
  ticker=c("AA","AAPL"),
  dir=TRUE,
  extension="txt",
  header=FALSE,
  tradecolnames=NULL,
  quotecolnames=NULL,
  format="%Y%m%d%H:%M:%S");  
 
把数据从硬盘载入 R 中
  • 函数TAQLoad把数据载入 R 中

高频数据的处理

等间隔数据、数据同步

  • aggregatets(data,on="minutes",k=1)
  • refreshTime(list(stock1,stock2))

Realized volatility measures

波动率预测

  • HAR-模型 Heterogeneous Autoregressive
  • 它实现了三种类型的HAR模型
    • HAR-RV:
    • HAR-RV-J:
    • HAR-RV-CJ:Jump + Continuous Sample path Component Variation
harModel(
  data,
  periods = c(1, 5, 22),
  periodsJ = c(1,5,22),
  leverage=NULL,
  RVest = c("rCov", "rBPCov"),
  type = "HARRV",
  jumptest = "ABDJumptest",
  alpha = 0.05,
  h = 1,
  transform = NULL, ...)

HAR-RV: Dow Jones Industrial Average in 2008

 

用 R 进行高频金融数据分析简介的更多相关文章

  1. 【数量技术宅|金融数据分析系列分享】为什么中证500(IC)是最适合长期做多的指数

    更多精彩内容,欢迎关注公众号:数量技术宅.探讨数据分析.量化投资问题,请加技术宅微信:sljsz01 投资股票指数相比个股的优势 我们在投资股票的时候,如果持仓集中在一只或者有限几只股票上,恰好不幸遇 ...

  2. Python 金融数据分析库及相关框架

    BackTest框架库: PyAlgoTrade ZipLine 金融数据分析库: pandas

  3. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  4. R语言数据处理利器——dplyr简介

    dplyr是由Hadley Wickham主持开发和维护的一个主要针对数据框快速计算.整合的函数包,同时提供一些常用函数的高速写法以及几个开源数据库的连接.此包是plyr包的深化功能包,其名字中的字母 ...

  5. Python数据分析简介

    1,Python作为一门编程语言开发效率快,运行效率被人诟病,但是Python核心部分使用c/c++等更高效的语言来编写的还有强大的numpy, padnas, matplotlib,scipy库等应 ...

  6. R vs Python,数据分析中谁与争锋?

    R和Python两者谁更适合数据分析领域?在某些特定情况下谁会更有优势?还是一个天生在各方面都比另一个更好? 当我们想要选择一种编程语言进行数据分析时,相信大多数人都会想到R和Python——但是从这 ...

  7. 初次用R的实际案例数据分析

    这是一次教授布置的期末作业,也是书籍<商务数据分析与应用>的一个课后作业 目录 数据描述 数据预处理 描述性统计分析 模型分析(方差分析) 数据描述 非学位职业培训机构的178个学员的数据 ...

  8. 金融数据分析还能这样做?快试试这个BI工具小白也能学会!

    说起银行.保险.股票投资等这些金融行业,大多数人都认为它们都是依靠数据驱动的企业,毕竟大数据的诞生本来就是为了金融信息流通而服务的,但是事实真的是这样吗? 事实并非如此,真正在金融行业做数据分析的人, ...

  9. R语言统计学习-1简介

    一. 统计学习概述 统计学习是指一组用于理解数据和建模的工具集.这些工具可分为有监督或无监督.1.监督学习:用于根据一个或多个输入预测或估计输出.常用于商业.医学.天体物理学和公共政策等领域.2.无监 ...

随机推荐

  1. iOS 利用for循环创建九宫格

    // 利用for循环创建九宫格 - (void)createScratchableLatex{ // 总列数 ; // 每一格的尺寸 CGFloat cellW = (self.frame.size. ...

  2. C++函数CString类常用函数

    C++ STL库里有很多与字符串操作相关的函数,熟练应用STL,字符串的处理将变得轻松.自在. 字符串截取函数: 1.CString Left( int nCount ) const;    //从左 ...

  3. nw_socket_handle_socket_event解决

    http://www.bkjia.com/IOSjc/1158465.html 出现问题如下 to a parent directory scheduled for deletion nw_endpo ...

  4. SpringMVC的controller方法上若需要参数 如User

    Bean: public class User {    private String name;     private String password;    public String getN ...

  5. 集合框架之——迭代器并发修改异常ConcurrentModificationException

    问题: 我有一个集合,如下,请问,我想判断里面有没有"world"这个元素,如果有,我就添加一个"javaee"元素,请写代码实现. 使用普通迭代器出现的异常: ...

  6. june 14

    Thank you for your applying for employment with our company. Your application is now being processed ...

  7. CSharp任何可比较的数据类型(大小比较泛型实现方法)封装

    /// <summary> /// 判定A等于B(A.CompareTo(B)==0) /// </summary> /// <typeparam name=" ...

  8. composer 安装

    安装composer wget http://curl.haxx.se/ca/cacert.pem curl -sS https://getcomposer.org/installer | php - ...

  9. 基于AWS的云服务架构最佳实践

    ZZ from: http://blog.csdn.net/wireless_com/article/details/43305701 近年来,对于打造高度可扩展的应用程序,软件架构师们挖掘了若干相关 ...

  10. Web程序的运行原理及流程(二)

    其实WEB服务器和WEB应用服务器这两个概念特别容易混淆  可以理解为装了不同软件(服务)的两台计算机(服务器)吧 先对两个概念做一个简单介绍 了解了基本的概念 我们再用两个典型的例子做一下比较(建立 ...