世界上有些问题看似是随机的(stochastic),没有规律可循,但很可能是人类还未发现和掌握这类事件的规律,所以说它们是随机发生的. 随机漫步(Random  Walk)是一种解决随机问题的方法,它与人类生活息息相关,例如醉汉行走的轨迹.布朗运动(Brownian Motion).股票的涨跌等都可以用它来模拟.随机漫步已经应用到数学,物理,生物学,医学,经济等领域. 假设某地有一个醉汉,每一秒钟会朝“东”,“南”,“西”,“北”中的一个方向走一步,那么这个醉汉在走了500步之后会在什么地方?1…
[ML学习笔记] 决策树与随机森林(Decision Tree&Random Forest) 决策树 决策树算法以树状结构表示数据分类的结果.每个决策点实现一个具有离散输出的测试函数,记为分支. 一棵决策树的组成:根节点.非叶子节点(决策点).叶子节点.分支 算法分为两个步骤:1. 训练阶段(建模) 2. 分类阶段(应用) 熵的概念 设用P(X)代表X发生的概率,H(X)代表X发生的不确定性,则有:P(X)越大,H(X)越小:P(X)越小,H(X)越大. 信息熵的一句话解释是:消除不确定性的程度…
1. 从细菌的趋化性谈起 0x1:物质化学浓度梯度 类似于概率分布中概率密度的概念.在溶液中存在不同的浓度区域. 如放一颗糖在水盆里,糖慢慢溶于水,糖附近的水含糖量比远离糖的水含糖量要高,也就是糖附近的水糖的浓度高,离糖越远的水糖的浓度越低. 这种浓度的渐减(反方向就是渐增)叫做浓度梯度.可以用单位距离内浓度的变化值来表示.同样,温度.电场强度.磁场强度.重力场.都有梯度的. 化学溶液的浓度梯度的概念和概率分布的梯度类似,都代表了值下降的方向. 0x2:趋化性细菌的运动方式 细菌趋化性是指有运动…
随机漫步 # random_walk.py 随机漫步 from random import choice class RandomWalk(): """一个生成随机漫步数据的类""" def __init__(self, num_points=5000): """初始化随机漫步的属性""" self.num_points = num_points # 所有随机漫步都始于(0, 0) se…
[论文阅读笔记] Community aware random walk for network embedding 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问题 先前许多算法都只考虑了网络的局部拓扑结构信息,忽略了原始网络中潜藏的社区信息. (2) 主要贡献 Contribution: 为了结合聚类将表示学习应用于基于图结构的社区发现任务上,本文在随机游走过程中结合了社区信息,使得同社区节点具有相近的表示向量,方便聚类任务. (3) 算法原理 CARE算法框架主要包含两个…
Jmeter随机生成/随机选取/csv读取关键字 一.随机生成关键字 随机生成关键字,需要组件:随机变量配置元件(Random Variable)  该组件的作用是生成字符+随机数字格式的字符串,并保存在变量中,以便后续使用  下面几种格式的字符串都是可以通过该组件来生成的 01-selenium selenium-01 se001lenium 2017 1.步骤详情: """ 步骤一:选择Web Test Plan模版 1.点击templates按钮 2.选择Buildin…
          大白话5分钟带你走进人工智能-第二十九节集成学习之随机森林随机方式 ,out  of  bag  data及代码(2) 上一节中我们讲解了随机森林的基本概念,本节的话我们讲解随机森林的随机方式,以及一些代码. 目录 1-随机森林随机方式 2-out  of   baf data 3-代码 1-随机森林随机方式 我们先来回顾下随机森林中都有哪些随机?     第一:用Bagging生成用来训练小树的样本时,进行有放回的随机抽样.                 第二:抽样数据之…
场景: 一个新妈妈给刚出生的宝宝买用品,随着宝宝的长大,不同的阶段需要不同的物品. 这个场景中涉及到考虑用户所处阶段,给用户推荐物品的问题. 如果使用用户协同过滤,则需要根据购买记录,找到与用户处于同一阶段的用户. 不加入分类信息,单纯使用物品信息,则可能因为买了不同牌子的尿布,而判断为非相似用户, 所以加入商品分类信息 算法步骤: 1.   加入分类信息 1)   根据时间将用户交易记录分成若干阶段(比如,近90天,近360天-近90天,...) 2)   对于中的记录(以中的为例),在向量的…
Random Walk Time Limit: 5000/2000 MS (Java/Others)    Memory Limit: 65535/65536 K (Java/Others)Total Submission(s): 81    Accepted Submission(s): 35 Problem Description Yuanfang is walking on a chain. The chain has n nodes numbered from 1 to n. Every…
Maximum Random Walk Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 756    Accepted Submission(s): 419 三维dp,一维的话根本没有办法开展,二维的话没办法保存当前位置或者最远位置,所以只能用三维的. 看不懂滚动数组之类的操作,只能傻傻的写. 具体内容在代码里标注了,三重循环,从i,j,…
Python进阶(十)----软件开发规范, time模块, datatime模块,random模块,collection模块(python额外数据类型) 一丶软件开发规范 六个目录: #### 对某某项目进行一个标准化的开发,进行规范化. #bin : 启动项目程序的主入口 #conf : 项目的配置文件 #core : 主要逻辑(业务逻辑) #db : 存放数据() #lib : 辅助文件(存放公共的一些方法) #README : 项目文档说明 ​ 二丶time模块(时间模块) 时间的三种方…
1. 关于全局最优化求解   全局最优化是一个非常复杂的问题,目前还没有一个通用的办法可以对任意复杂函数求解全局最优值.上一篇文章讲解了一个求解局部极小值的方法--梯度下降法.这种方法对于求解精度不高的情况是实用的,可以用局部极小值近似替代全局最小值点.但是当要求精确求解全局最小值时,梯度下降法就不适用了,需要采用其他的办法求解.常见的求解全局最优的办法有拉格朗日法.线性规划法.以及一些人工智能算法比如遗传算法.粒子群算法.模拟退火算法等(可以参见我之前的博客).而今天要讲的是一个操作简单但是不…
1 pagerank算法的基本原理 Pagerank算法是Google的网页排名算法,由拉里佩奇发明.其基本思想是民主表决.在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高.同时,排名高的网站链接可靠,所以这些链接的权重会更大. 网页的排名来自于所有指向这个网页的其他网页的权重之和.y的排名=x1+x2+x3+x4=0.081 接下来的问题是x1,x2,x3,x4的权重是多少?这些权重应该来自这些网站本身的网页的排名.这就是说在计算一个网页y的排名的过程…
给定了一个时间顺序向量\(z_1,...,z_T\),rw模型是由次序r来定义的,\(z_t\)仅取决于前\(t-r\)个元素.当r = 1时为最简单的RW模型. 给定了向量的其他元素,\(z_t\)的条件分布为: \(z_t|z_{t-1} ~ Normal(z_{t-1} ,\sigma^2)\)…
python指定概率随机取值参考如下: 下面是利用 np.random.choice()指定概率取样的例子: np.random.seed(0) p = np.array([0.1, 0.0, 0.7, 0.2]) index = np.random.choice([0, 1, 2, 3], p = p.ravel()) 这意味着你可以以下面的概率分布取到index所对应的数值:P(index=0)=0.1,P(index=1)=0.0,P(index=2)=0.7,P(index=3)=0.2…
目录 随机森林原理 随机森林代码(Spark Python) 随机森林原理 参考:http://www.cnblogs.com/itmorn/p/8269334.html 返回目录 随机森林代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1jHWKG4I 密码:acq1 # -*-coding=utf-8 -*- from pyspark import SparkConf, SparkContext sc = SparkContext('local'…
class Walker { int x; int y; Walker() { x = width/2; y = height/2; } void display() { stroke(0); point(x,y); } void step() { int choice = int(random(4)); //0,1,2,or 3 if(choice == 0) { x++; } else if(choice == 1) { x--; } else if(choice == 2) { y++;…
在查询分析器中执行:select rand(),可以看到结果会是类似于这样的随机小数:0.36361513486289558,像这样的小数在实际应用中用得不多,一般要取随机数都会取随机整数.那就看下面的两种随机取整数的方法:1.A:select floor(rand()*N) ---生成的数是这样的:12.0 B:select cast( floor(rand()*N) as int) ---生成的数是这样的:12 2.A:select ceiling(rand() * N) ---生成的数是这…
1. 题目描述一个人沿着一条长度为n个链行走,给出了每秒钟由i到j的概率($i,j \in [1,n]$).求从1开始走到n个时间的期望. 2. 基本思路显然是个DP.公式推导也相当容易.不妨设$dp[i], i \in [1,n]$表示由i到n的期望时间.\begin{align}    dp[i] &= \Sigma_{j=1}^{n} p(i, j) (dp[j] + 1),    &j<n\\    dp[i] &= 0 &i=n\end{align}显然这是…
在很多系统环境下大家都会用到字母组合各种编码,下面推荐大家非常实用的PHP代码. $num由几个字母组合. $s字母包含大小写,可以自己调配大写还小写. <?php function makecode($num=4) { $re = "; $s = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'; while(strlen($re)<$num) { $re .= $s[rand(0, strlen($s)-1)]; //从…
此文主要总结的是一种随机算法,旨在判断一个expander图上两点是否连通.复杂度O(logn).算法思路清奇. expander graph博大精深,如果对expander graph的生成,family感兴趣,可以去看一下陶哲轩巨巨巨神的博客What's new,里面有篇博文讲了这些问题. 个人理解,算法可以归纳成一句话:如果expander图G是连通的,那么概率分布p在图G上随机游走l=O(logn)步后会高度逼近等概率分布. 证明见下:第一张图约定了一些符号,第二张图证明了定义的(显然大…
例如取2到3中的 随机小数(一位)或整数 mt_rand(20,30)/10 mt_rand()是随机取整函数 先扩大一定倍数,再缩小相应倍数,倍数代表精确到哪一位…
使用Math.random()生成随机数 0.7489584611780002数字的.toString(n) 将数字转换为 n 进制的字符串 n取值范围(0~36)"0.vbpjw8lipf9"使用 substr 截取去除前面的 0. 使用 toUpperCase() 转换为大写 L7NE21W7LMP Math.random().toString(36).substr(2).toUpperCase(); 使用这个方式可以生成随机颜色 #AF9838 '#' + Math.random…
思路:由于m非常小,只有5.所以用dp[i]表示从位置i出发到达n的期望步数. 那么dp[n] = 0 dp[i] = sigma(dp[i + j] * p (i , i + j)) + 1 .   (-m <= j <= m) 从高位向低位暴力消元,每次消去比他高的变量. 如 dp[i] = a1 * dp[i - 1] + a2 * dp[i - 2] …… am * dp[i - m]. #include<iostream> #include<stdio.h>…
题意: 走n步,给出每步向左走概率l,向右走概率r,留在原地的概率 1-l-r,求能达到的最远右边距离的期望. 分析: 开始按期望逆求的方式分析,但让求的就是右边界没法退,懵了一会,既然逆着不能求,就先正着求概率,再根据期望的定义来求,试试行吗,想了想状态,dp[i][j][k],表示走了i步当前位置是j最远右边界是k时的概率,因为可能位置是负的所以位置都加上n. #include <map> #include <set> #include <list> #includ…
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4487 题目大意: 开始位置在0,每一步可以向右向左或者不动,问走了n步后,路径中能到达最右的期望. 解题思路: 比赛的时候,题目理解错了,认为要回到起点.-_-   -_- 由于最后到达的位置不确定,每条路径的最右距离也不确定. 所以记dp[i][j][k]为走了i步,到达j位置,且路径中最右位置为k时概率. 显然k>=j 否则为0 如果k==j,这一步有两种情况,1.刚好第一次达到最大 2.先前…
pid=4579" style="background-color:rgb(51,255,51)">题目链接 题意: n个点.依照题中给的公式能够求出随意两个点转移的概率.求从1到n的期望转移次数 分析: 设dp[i]为从i到n的期望,那么能够得到公式dp[i] = sigma(dp[i + j] * p(i + j, i)) + 1.1 <= j <= m 把这个式子展开来:dp[i - m] * p(i - m, i) + dp[i - m + 1] *…
给你一幅N*M的地图,地图中有不能到达的障碍物'#'与可以走的点'.',从(1,1)开始走到(N,M),其中每一次走动均等概率地向周围的可达的格子走去,求到达(N,M)的期望步数.(N,M<=10) 一开始根本不知道这题居然是用高斯消元来做的,感觉非常神奇,高斯消元作用就是你自己列出一系列关于期望的方程,然后求一个$E(1,1)$的变量值即可. 首先可以设每一个格子(X,Y)到达(N,M)的期望值为未知数$E(x,y)$,那么我们有N*M个格子,有N*M个未知数即N*M个变量,然后方程怎么列呢?…
题目 有一个 $N \times M$ 大小的格子,从(0, 0)出发,每一步朝着上下左右4个格子中可以移动的格子等概率移动.另外有些格子有石头,因此无法移至这些格子.求第一次到达 $(N-1, M-1)$ 格子的期望步数.($2 \leq N,M\leq 10$) 分析 设 $E(x, y)$ 表示从 (x, y) 出发到终点的期望步数. 我们先考虑从 $(x, y)$  向上下左右4个方向都可以移动的情况,由于向4个方向的移动的概率是相等的,因此可以建立如下关系: $$\begin{alig…