[stat.simulation] Hasting-Metropolis Algorithm

问题背景：我们有一些观测数据X，这些数据假设是取值为1,...,m；我们还知道每个数据观测到的频数为: $b(j), j=1,...,m. B=\sum_{j=1}^mb(j)$

　　但是我们现在无法计算B的大小。（这是一个假设，毕竟计算一串数字的和不是难事）

问题：我们需要通过仿真产生一串随机变量，并且它们的概率分布函数为：

$\pi(j)=b(j)/B, j=1,...,m$

分析：如果B是可以计算的，那么 $\pi$ (j)自然也是可以计算的。然后自然很容易随机生成服从这个概率分布的一串随机数。但是B不能计算。。。我们可以采用一个曲线救国的方案。

　　直观上来考虑这个问题，产生随机数时是一个一个地产生随机数，每个随机数取值为1,...,m中某一个。我们可以：

1）把一个随机数看成一个状态；

2）一个随机数的产生取决于前一个随机数，那么每个状态取决于前一个状态；

问题等效：对于状态{1,...,m}，有某个Markov Chain状态转移矩阵P， $\text{P}(i,j)=\Pr(i\rightarrow j)$ ,随机选择一个初始状态 $X[1]\in{1,...,m}$ ，根据状态转移矩阵P,，依次产生一个状态序列 $\{X[1], X[2], X[3], ...\}$ 。但是，重点是我们需要设计这个转移矩阵P，使得最终的产生的状态序列的概率分布为 $\pi$ ，也就是说这个Markov Chain的最终稳定状态时各个状态的概率分布为 $\pi$ 。

Hasting-Metropolis算法描述

　　算法引入了一个随机选择的Markov Chain转移矩阵Q， $\text{Q}(i,j)=\Pr(i\rightarrow j)$ 。注意Q不是上面讲的P，而是用来构造P的一个辅助状态转移矩阵。构造的过程：

1）根据Q，从当前状态，设为i，转移到状态下一个状态，设为j；

2）引入另一个概率函数 $\alpha(i, j)$ ，这个概率决定转移到下一个状态j或者停留在现在的状态i；

结合上述1,2）可以得到一个新的转移矩阵，并且可以经过精心构造 $\alpha(i, j)$ ，使得这个矩阵作为解决“等效问题”中的P矩阵，下面来看如何“精心构造”：

根据1,2）

$\text{P}(i,j)=q(i,j) \alpha(i,j), \text{when } i\ne j;$

$\text{P}(i,i)=q(i,i)+q(i,j) (1-\alpha(i,j))$

根据平稳Markov Chain的“时序可逆”性质：

$\pi(i)P(i,j)=\pi(j)P(j,i) \text{ for }i\ne j$

$\Leftarrow \pi(i)q(i,j)\alpha(i,j)=\pi(j)q(j,i)\alpha(j,i)\\ \Leftarrow \left\{ \begin{array}{c} \alpha(i,j)=1, \\ \alpha(j,i)=\frac{\pi(i)q(i,j)}{\pi(j)q(j,i)} \\ \end{array} \right$

$\left\{ \begin{array}{c} \alpha(j,i)=1, \\ \alpha(i,j)=\frac{\pi(j)q(j,i)}{\pi(i)q(i,j)} \\ \end{array} \right$

因为 $\alpha(i, j)$ 是一个概率值，必须小于1，所以最终 $\alpha(i, j)$ 的构造为：

$\alpha(i,j)=\min\{1,\frac{\pi(j)q(j,i)}{\pi(i)q(i,j)}\}$

但是 $\pi$ 是未知的（因为B无法求值），好在上式中是 $\pi$ (i)/ $\pi$ (j)=b(i)/b(j)，那么：

$\alpha(i,j)=\min\{1,\frac{b(j)q(j,i)}{b(i)q(i,j)}\}$

Hasting-Metropolis算法流程

1）选择一个不可约Markov Chain概率转移矩阵 $\text{Q}(i,j)=\Pr(i\rightarrow j)$ ；随机选择初始状态 $k\in \{1,...,m\}$ ;

2) let n=1, X[n]=k;

3) 生成随机数 $X \text{, such that } \text{P}\{X=j\}=q(X[n],j)$ ，生成随机数 U∈（0, 1）

4) 如果 $U<$b(X)q(X,X[n])$/$b(X[n]q(X[n],X)$$ ，则选择NS=X；否则选择NS=X[n];

5) n=n+1, X[n]=NS;

6) go to 3)

说明，以上在讨论函数 $\alpha(i, j)$ 和算法流程中，都没有特别考虑i = j的情况。原因是i=j时“不失一般性”。此时 $\alpha(i, j)$ =1，算法步骤4）一定会选择NS=X,而此时X==X[n]。所以，算法步骤3）中如果产生的X==X[n]，那么4）定然会保持原来状态从而X[n+1]<-X[n]。

仿真例子

通过R语言实现用H-M算法采样服从混合高斯分布密度函数。

主程序：

source("intgMatrix.R")

source("sampleByPr.R")

FF = 10000# sample points

br<-rnorm(FF/2, 0, 10)

br2<-rnorm( FF/2, 60, 10)

br <- c(br, br2)

br<-round(br)

tbl <- table(br)

b<-unname(tbl)   # a sequence of number

m <- length(b)

#generate Q

r<-c()

for(i in 1:m)

{

  r_ <- runif(m, 0, 1)

  r_ <- r_ / sum(r_)  # nomalize

  r<- c(r, r_)

}

Q<- t(matrix(r, m, m))

Qint <- intgMatrix(Q)     # row-based integral

# start to sample sn data

sn = FF  # #sample

X <- c()  # sample data (index of b)

# initial step

k<- round(runif(1, 1, m))

X[1] <- k

# interation steps

for(n in 1:(sn-1))

{

  PrX_j <- Qint[X[n], ]  # last sample's index as row-index in Q

  while(TRUE){

    X_tmp <- X[n]

    X_tmp <- sampleByPr(PrX_j) # the index of X[n]

    if(X_tmp != X[n]){

      break

    }

  }

  U <- runif(1, 0, 1)

  # for alph(i, j)

  al_ <- (b[X_tmp] * Q[X_tmp, X[n]]) / (b[X[n]] * Q[X[n], X_tmp])

  if(al_ > 1){al_ <- 1}

  NS <- X[n]

  if(U < al_) {

    NS <- X_tmp

  }

  X[n + 1] <- NS

}

# plot

bnn<-as.numeric(b)

plot(1:length(bnn),bnn,col="red")

Xnn <- as.numeric(table(X))

lines(1:length(Xnn),Xnn/rt,col="green")

概率积分矩阵，Qi[i,k]=∑_j=1,..,kQ[i,j]

intgMatrix <- function(Q)

{

  Qi<-matrix(nrow=dim(Q)[1], ncol = dim(Q)[2])

  Qi[, 1] = Q[,1]

  for(i in 1:dim(Q)[1]){

    for(j in 2:dim(Q)[2]){

      Qi[i,j] <- Qi[i, j- 1] + Q[i, j]

    }

  }

  return(Qi)

}

根据概率积分向量生成采样点。

概率积分向量pi[i]=∑_j=1,..,ip[i],其中p[i]=Pr{X=i}为原始概率分布

sampleByPr <- function(Pr_vector)

{

  ru <- runif(1,0,1)

  for(i in 1:length(Pr_vector)){

    if(Pr_vector[i] > ru){

      return(i)

    }

  }

}

[stat.simulation] Hasting-Metropolis Algorithm的更多相关文章

MCMC: The Metropolis Sampler
本文主要译自 MCMC: The Metropolis Sampler 正如之前的文章讨论的,我们可以用一个马尔可夫链来对目标分布 $p(x)$ 进行采样,通常情况下对于很多分布 $p(x)$ ...
My Open Source Projects
• MyMagicBox (https://github.com/yaoyansi/mymagicbox) Role: Creator Miscellaneous projects for e ...
（转）Markov Chain Monte Carlo
Nice R Code Punning code better since 2013 RSS Blog Archives Guides Modules About Markov Chain Monte ...
Top 10 Algorithms of 20th and 21st Century
Top 10 Algorithms of 20th and 21st Century MATH 595 (Section TTA) Fall 2014 TR 2:00 pm - 3:20 pm, Ro ...
QuantStart量化交易文集
Over the last seven years more than 200 quantitative finance articles have been written by members o ...
MCMC&Gibbs sampling
Note of Markov Chain Monte Carlo and Gibbs Sampling : http://pan.baidu.com/s/1jHpWY1o 序:A major lim ...
Metropolis Hasting算法
Metropolis Hasting Algorithm: MH算法也是一种基于模拟的MCMC技术,一个非常重要的应用是从给定的概率分布中抽样.主要原理是构造了一个精妙的Markov链,使得该链的稳态 ...
Metropolis Light Transport学习与实现
这段时间一直在看Metropolis Light Transport(简称mlt),现利用这篇博文把之前看资料已经coding上的一些体会记录下来. 1.Before MLT 在MLT算法被提出之前, ...
[Bayes] Metropolis-Hastings Algorithm
[Bayes] prod: M-H: Independence Sampler for Posterior Sampling dchisq gives the density, ...

随机推荐

RHEL6.4编译安装企业级LAMMP平台
一.LAMMP简介二.使用软件及服务器架构说明三.配置及安装过程 1.安装arp与httpd 2.安装mysql 3.安装php(php-fpm) 4.安装Xcache ...
学习opencv之路（一）
先看一下<学习opencv> 找几个demo 学会相机标定我做的是单目相机的标定.
《java小应用程序（Applet）和java应用程序（Application）分别编写的简单计算器》
Application和Java Applet的区别.Java语言是一种半编译半解释的语言.Java的用户程序分为两类:Java Application和Java Applet.这两类程序在组成结构和 ...
c++中的一些容易混淆的研究
(1).TRUE/FALSE与ture/false以及NULL与null的区别是什么? 1.首先我们要了解true/false是标准c++中定义的关键字,在c语言中是没有bool类型的. 所以为了弥补 ...
Java源码分析系列
1) 深入Java集合学习系列:HashMap的实现原理 2) 深入Java集合学习系列:LinkedHashMap的实现原理 3) 深入Java集合学习系列:HashSet的实现原理 4) 深入Ja ...
time元素和datetime、pubtime属性
time:对一个时间进行标识 <time datetime="2012-12-24">2012-12-24</time> datetime:时间的值 pub ...
K-近邻算法
废话不多说,直接放码过来. from numpy import * import operator def createDataSet () : group = array([[,],[,0.1]]) ...
AI第二次作业
2.9 设有如下语句,请用相应的谓词公式分别把它们表示出来: (1)有的人喜欢梅花,有的人喜欢菊花,有的人既喜欢梅花又喜欢菊花. 解:设 P(x): x是人 L(x,y): x喜 ...
Eclipse利用Axis2插件构建Web Service并测试
在学习Web Service的时候,从网上找到前辈的博客http://www.cnblogs.com/hexinlin/p/3358558.html,并依此文的方法按部就班:编写欲发布的java类He ...
Guid与id区别
一.产生Guid的方法 1.SqlServer中使用系统自带的NEWID函数: select NEWID() 2.C#中,使用Guid类型的NewGuid方法: Guid gid; ...

[stat.simulation] Hasting-Metropolis Algorithm

[stat.simulation] Hasting-Metropolis Algorithm的更多相关文章

随机推荐

热门专题