QM3_Statistics Concepts and Market Returns

Basic Concepts
Terms
Descriptive Statistics
- Describes the important aspects of large data sets.
- 统计
- 概率
- 分布
Inferential statistics
- Involves making forecasts, estimates, or judgments about a larger group from the smaller group.
- 预测
- 估计
- 判断

Measurement scales

考点:
- 给描述, 判断是哪种尺度
- 给尺度, 判断孰强孰弱
Frequency distribution
Central Tendency (第一维度,中心趋势)
Mean
Calculation
- Arithmetic mean (算术平均)
- Population Mean
- Sample Mean
- Population Mean
- Geometric mean (几何平均)
- Harmonic mean (调和平均, I级考试不考)
- Weighted mean (加权平均)

- 样本均值中相当于权重都是1/n, 而weighted mean就是不等权重(w1,w2,...wn).
Properties (性质)
- Arithmetic mean : 单期收益率的表现
- focus on average single-period performance
- sensitive to extreme values
- Geometric mean: 多期收益率的表现
- focus on multi-period performance
- Weighted mean: 多用于计算期望值 (算期望就是算加权平均)
- userd to calculate the portfolio return/expected value based on probabilities
- Harmonic Mean <= Geometric Mean <= Arithmetic Mean
- Median 中位数 与 Mode 众数
- 例: 一组数, 1,1,2,4,8.
- median: 一共有五个数, 中间的数是2, 所以median是2. 若这个数组是1,2,4,8. 中位数则是(2+4)/2 = 3.
- mode : 1出现了两次, 所以众数是1.
Quantile (分位点) **
Definition
- A value at or below which a stated fraction of the data lies.
- Quantiles 四分位点
- Quintiles 五分位点
- Deciles 十分位点
- Percentiles 百分位点

Calculation
- Step 1: formula for location of data in ascending order (必须先把所有数据从小到大排列)
- Step 2: 用公式计算
- 例: for data with 17 observations, find out the location of 3rd quintile.

- 注: 1. value 中10和11的顺序写错了, 数值应该是要按顺序排列的.
- 2. 如果要计算3rd quintile这个位置上的值的话, 应该是(20+23)/2.
考点
- 描述
- 例: 第一个四分位点 --> 有25%的数小于第一个四分位点(因数据是ascending order排列的,所以是小于).
- 计算
- Ly = (n+1)y/100 (算location)
- 算value (算特定分位点的数值)
金融有风险, 风险有不确定性, 所以用离散程度来度量风险, 方差或者标准差就是用来度量离散程度的;
金融中的收益用均值 mean 来度量.
Risk <-- uncertainty <-- dispersion <-- variance, standard deviation
Dispersion (第二维度,离散程度,即偏离均值的程度)
Absolute dispersion (绝对离散程度)
Range (范围)
- Maximum Value - Minimum Value
Mean Absolute Deviation (MAD, 均值绝对偏差)
- MAD <= 西格玛

Variance (方差)
- MAD是绝对值, 不好计算,所以平方之后就引入了方差.
- Population 总体
- Sample 样本
Standard deviation (标准差, 把方差开根号)
- Population 总体
- Sample 样本

- n-1 是为了满足无偏性或者自由度

Relative dispersion (相对离散程度) ***
Coefficient of variation (CV, 变异系数)
- 每赚一块钱所承担的风险
- Calculation

- s: 样本标准差 (代表风险); x拔: 样本均值(代表收益)
- Characteristics
- CV has no units of measurement
- a measure of risk per unit of mean return
- the lower the better
Sharpe ratio (夏普比率)
- 每承担单位风险所获得的超额收益率
- Calculation
- Characteristics
- Sharpe ratio has no units of measurement
- a measure of exccess return per unit of risk
- the higher the better
考点
计算
- CV
- Sharpe ratio
描述
- CV: 每赚一块钱所承担的风险
- Sharpe ratio: 每承担单位风险所获得的超额收益
- 性质
- 变异系数CV越小越好
- Sharpe ratio越大越好
Chebyshev's inequality (切比雪夫不等式)
- 概念
- For any distribution with finite variance, the minimum percentage of observations that lie within k standard deviation of the mean would be 1-1/k*k, given k>1.
- 对任何一组观测值, 个休落在均值周围k个标准差之内的概率不小于1-1/k*k, 对任意k>1.
- 例题
考点
- 已知k, 需要计算概率1-1/k*k
- 已知概率, 需要反算出k, 再算出区间
- 已知区间, 需要计算k, 再算出概率
Skewness (第三维度,偏度) ***

肥尾: 取到极端值的概率较大
Kurtosis (第四维度,峰度) **

正态分布的峰度定义为3.
T-分布有特殊, 是低峰肥尾. ? 哪一章提到?
Z-分布?
QM3_Statistics Concepts and Market Returns的更多相关文章
- Statistical Concepts and Market Returns
Statistical Concepts and Market Returns Categories of statistics Descriptive statistics: used to sum ...
- AIMR 固定收益推荐读物
目录 AIMR Suggested Fixed-Income Readings I. Perspectives on Interest Rates and Pricing of Traditional ...
- SVD分解.潜语义分析.PythonCode
原文链接:http://www.cnblogs.com/appler/archive/2012/02/02/2335886.html 原始英文链接:http://www.puffinwarellc.c ...
- 潜在语义分析Latent semantic analysis note(LSA)原理及代码
文章引用:http://blog.sina.com.cn/s/blog_62a9902f0101cjl3.html Latent Semantic Analysis (LSA)也被称为Latent S ...
- Quantitative Startegies for Achieving Alpha(二)
Chapter 3 The Day-To-Day Drivers Of Stock Market Returns Summary: (1) Earning growth is the primary ...
- An Introduction to Stock Market Data Analysis with R (Part 1)
Around September of 2016 I wrote two articles on using Python for accessing, visualizing, and evalua ...
- (二)ROS系统架构及概念 ROS Architecture and Concepts 以Kinetic为主更新 附课件PPT
第2章 ROS系统架构及概念 ROS Architecture and Concepts PPT说明: 正文用白色,命令或代码用黄色,右下角为对应中文译著页码. 这一章需要掌握ROS文件系统,运行图级 ...
- (转) Using the latest advancements in AI to predict stock market movements
Using the latest advancements in AI to predict stock market movements 2019-01-13 21:31:18 This blog ...
- jQuery学习--Code Organization Concepts
jQuery官方文档: http://learn.jquery.com/code-organization/concepts/ Code Organization Concepts(代码组织概念) ...
随机推荐
- javascript中的eval函数
eval()只有一个参数,如果传入的参数不是字符串,则直接返回这个参数.否则会将字符串当成js代码进行编译,如果编译失败则抛出语法错误(SyntaxError)异常.如果编译成功则开始执行这段代码,并 ...
- 排序算法入门之快速排序(java实现)
快速排序也是一种分治的排序算法.快速排序和归并排序是互补的:归并排序将数组分成两个子数组分别排序,并将有序的子数组归并以将整个数组排序,会需要一个额外的数组:而快速排序的排序方式是当两个子数组都有序时 ...
- SQL遇到的问题
1.问题描述:拼接sql字符串涉及到表变量时报错. 解决办法:把表变量的定义一同放在字符串中. 2.问题描述:EF添加实体后,调用存储过程调用不到 解决办法:必须先db.SaveChanges()后 ...
- 前端技术之_CSS详解第六天--完结
前端技术之_CSS详解第六天--完结 一.复习第五天的知识 a标签的伪类4个: a:link 没有被点击过的链接 a:visited 访问过的链接 a:hover 悬停 a:active 按下鼠标不松 ...
- 多层嵌套的json数据
很多时候我们见到的json数据都是多层嵌套的,就像下面这般: {"name":"桔子桑", "sex":"男", , & ...
- SpringMVC+GSON 对象序列化--日期格式的处理
Gson异常强大因此使用它代替了Jackson作为SpringMVC消息转换器. 在自己的项目中,发现对象在序列化后,日期格式出现了问题. 先看问题 在员工表中有一列是生日,字段类型为Date,也就是 ...
- 云计算一:VMware workstation的安装和使用教程
VMware workstation的安装和使用教程 一.VMware 安装 1.从网上找到VMware的安装包以及要安装的映像文件,下载到本地,然后备份一份存储到百度云盘. 链接:http://pa ...
- 嵌入Python系列 | 调用Python模块中无参数函数
开发环境 Python版本:3.6.4 (32-bit) 编辑器:Visual Studio Code C++环境:Visual Studio 2013 需求说明 在用VS2013编写的Win32程序 ...
- 【踩坑】iconfont使用异常bug
你见过html页面上'x'字符变成打印机图标么?一般人应该没有. -----------------------诡异bug----------------------- 今天测试报了一个bug,说页面 ...
- Python_二叉树
BinaryTree.py '''二叉树:是每个节点最多有两个子树(分别称为左子树和右子树)的树结构,二叉树的第i层最多有2**(i-1)个节点,常用于排序或查找''' class BinaryTre ...









