作者:李洪成

摘自:http://cos.name/wp-content/uploads/2013/11/ChinaR2013SH_Nov03_04_LiHongcheng.pdf

高频数据

  • 金融市场中,逐笔交易数据(transaction by transaction data) 或逐秒记录数据 (tick by tick data) 被称为高频数据。纽约股票交易所的交易行情数据库包含了综合磁带系统报告的所有证券的交易和报价记录(Trades and Quotes- NYSE TAQ), 另外WRDS TAQ, Reuters, Bloomberg等。

高频数据的特点

  • 数据量大:一只股票一天中可以有几百万条交易
  • 交易间的时间间隔是不规则的,不是等间隔
  • 保存的数据由于多种原因会包含错误
    • 不正确的交易量
    • 失时效的价格
    • 一秒钟的多重交易
    • 不准确的时间 (innaccurate times)
某股票2010年10月4日到10月15日
相邻两个交易的价格变动频率
 
高频金融数据用于研究与交易过程和市场微观结构相关的大量问题
  • 股票买卖报价的动态性
  • 市场的流动性
  • 算法交易
  • 收益的实际波动率

Data Structure of Trade data

  • PRICE 交易价格
  • SIZE 交易股数
  • COND: 交易条件代码
  • CORR: 修改标识, 交易为正常即没有经 过校正、修改或者被标记为取消
  • G127 Combined "G", Rule 127, and stopped stock trade

Data Structure of Quote data

  • BID:卖价
  • BIDSIZ:卖出量,以100股为单位
  • OFR:买价
  • OFRSIZ:买入量
  • MODE:报价条件标识

R的高频数据分析包

  • R中针对高频数据的添加包:highfrequency
  • 该包最新版本为0.2,基于R 2.12.0或者更高 版本,依赖于 xts, zoo两个包。
  • highfrequency是另外两个已有R包的更新版 - 两个都被移除了

    • RTAQ (Cornelissen and Boudt 2012 ) TradeAnalytics project
    • realized (Payseur 2008)

Highfrequency主要功能

  • 组织高频数据
  • 高频数据的清理、整理
  • 高频数据的汇总
  • 高频数据的相关模型:
    • 波动率模型
    • 流动性

三类高频数据

  • NYSE TAQ数据库中的 .txt文件
  • WRDS数据库中的 .csv文件
  • Tickdata.com的.asc文件
  • 函数convert()可以把上述三类数据转换为xts对象
convert(
  from,
  to,
  datasource,
  datadestination,
  trades=TRUE,
  quotes=FALSE,
  ticker=c("AA","AAPL"),
  dir=TRUE,
  extension="txt",
  header=FALSE,
  tradecolnames=NULL,
  quotecolnames=NULL,
  format="%Y%m%d%H:%M:%S");  
 
把数据从硬盘载入 R 中
  • 函数TAQLoad把数据载入 R 中

高频数据的处理

等间隔数据、数据同步

  • aggregatets(data,on="minutes",k=1)
  • refreshTime(list(stock1,stock2))

Realized volatility measures

波动率预测

  • HAR-模型 Heterogeneous Autoregressive
  • 它实现了三种类型的HAR模型
    • HAR-RV:
    • HAR-RV-J:
    • HAR-RV-CJ:Jump + Continuous Sample path Component Variation
harModel(
  data,
  periods = c(1, 5, 22),
  periodsJ = c(1,5,22),
  leverage=NULL,
  RVest = c("rCov", "rBPCov"),
  type = "HARRV",
  jumptest = "ABDJumptest",
  alpha = 0.05,
  h = 1,
  transform = NULL, ...)

HAR-RV: Dow Jones Industrial Average in 2008

 

用 R 进行高频金融数据分析简介的更多相关文章

  1. 【数量技术宅|金融数据分析系列分享】为什么中证500(IC)是最适合长期做多的指数

    更多精彩内容,欢迎关注公众号:数量技术宅.探讨数据分析.量化投资问题,请加技术宅微信:sljsz01 投资股票指数相比个股的优势 我们在投资股票的时候,如果持仓集中在一只或者有限几只股票上,恰好不幸遇 ...

  2. Python 金融数据分析库及相关框架

    BackTest框架库: PyAlgoTrade ZipLine 金融数据分析库: pandas

  3. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  4. R语言数据处理利器——dplyr简介

    dplyr是由Hadley Wickham主持开发和维护的一个主要针对数据框快速计算.整合的函数包,同时提供一些常用函数的高速写法以及几个开源数据库的连接.此包是plyr包的深化功能包,其名字中的字母 ...

  5. Python数据分析简介

    1,Python作为一门编程语言开发效率快,运行效率被人诟病,但是Python核心部分使用c/c++等更高效的语言来编写的还有强大的numpy, padnas, matplotlib,scipy库等应 ...

  6. R vs Python,数据分析中谁与争锋?

    R和Python两者谁更适合数据分析领域?在某些特定情况下谁会更有优势?还是一个天生在各方面都比另一个更好? 当我们想要选择一种编程语言进行数据分析时,相信大多数人都会想到R和Python——但是从这 ...

  7. 初次用R的实际案例数据分析

    这是一次教授布置的期末作业,也是书籍<商务数据分析与应用>的一个课后作业 目录 数据描述 数据预处理 描述性统计分析 模型分析(方差分析) 数据描述 非学位职业培训机构的178个学员的数据 ...

  8. 金融数据分析还能这样做?快试试这个BI工具小白也能学会!

    说起银行.保险.股票投资等这些金融行业,大多数人都认为它们都是依靠数据驱动的企业,毕竟大数据的诞生本来就是为了金融信息流通而服务的,但是事实真的是这样吗? 事实并非如此,真正在金融行业做数据分析的人, ...

  9. R语言统计学习-1简介

    一. 统计学习概述 统计学习是指一组用于理解数据和建模的工具集.这些工具可分为有监督或无监督.1.监督学习:用于根据一个或多个输入预测或估计输出.常用于商业.医学.天体物理学和公共政策等领域.2.无监 ...

随机推荐

  1. java中的静态变量---static

    用static修饰符修饰的数据成员,并不是属于那个对象的,而是属于类.静态数据成员在定义的时候已经分配了内存,而此时对象还没有建立好. 当然它也是被保存到类的方法中的,而不是对象内存中,大家都是可以访 ...

  2. U-Mail反垃圾邮件网关过滤Locky勒索邮件

    近期,不少朋友圈有朋友发布相关的邮件提醒,说有关于Locky病毒勒索邮件的.看来这个病毒影响不小啊!下面就说说怎么来防止Locky勒索病毒的侵扰. 什么是Locky勒索病毒 Locky勒索病毒主要以邮 ...

  3. Android菜鸟成长记12 -- ORMLite的简单使用

    在我们的开发中,为了提高开发效率,我们一般都会使用到框架,ormilte则是我们必不可少的数据库框架. 对于ORMLite我也是今天才刚刚接触,我们先从一个简单的项目来了解它吧. ORMLite ja ...

  4. jquery实现动画

    animate() 方法 语法: $(selector).animate({params},speed,callback); 必需的 params 参数定义形成动画的 CSS 属性. 可选的 spee ...

  5. 你不知道的this指向

    javascript中,我们预想的this指向,有时候与预期不一样,直接上经典例子 window.name=2; var test={ 'name':1, 'getName':function(){ ...

  6. webpack配置sass模块的加载

    webpack管理的项目,我们希望用sass定义样式,为了正常编译,需要做如下配置.这里不讲webpack的入门,入门的文章,我推荐这篇<webpack入门>. 为了使用sass,我们需要 ...

  7. Java C# C语言中的占位符

    一般拼接一段字符串在编程中是很常见的事,下面简单做个总结: 什么是占位符?占位符就是先占住一个固定的位置,等着你再往里面添加内容的符号. 1.Java中处理方法: package com.amos; ...

  8. python学习之——selenium元素定位

    web自动化测试按步骤拆分,可以分为四步操作:定位元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告. 其中定位元素尤为关键,此篇是使用webdriver通过页面各个 ...

  9. LSD-SLAM深入学习(4)-非ROS改造

    前言 没错,距离上一次博客的发布已经俩月了,今天是圣诞节,圣诞快乐. 在前几篇中已经完成了ROS下面的一系列操作.如有任何问题,feel free to contact me at robotsmin ...

  10. 重启eclipse color theme失效的解决办法

    For Eclipse Mars users: In the main menu bar, go to Window > Preferences In the preference tree o ...