一般数学表示方法

  • 概率数学表示方法

    \(\large \begin{array}{rl} \\
    \bm{X}:& 符合某种概率分布的Random\ Variable(随机变量) \\
    \bm{x}:& \bm{rnorm}, 随机变量X的一个实例, , … \\
    \bm{f}:& \bm{pdf}, \bm{dnorm}, \text{Probability Distribution Function}\ of\ \text{Random Variable }X, … \\
    \bm{F}:& \bm{cdf}, \bm{pnorm}, \text{Cumulative Density Function}\ of\ \text{Random Variable }X, … \\
    \bm{P(X=k)}:& \bm{pmd}, \text{Probability Mass Distribution} \\
    \end{array}\)

  • 常用概率分布

    • Discrete(离散概率分布)

      • Discrete Uniform(离散均匀分布)
      • Bernoulli(伯努利分布)
      • Binomial(二项式分布)
      • Poisson(泊松分布)
      • Hypergeometric(超几何分布)
    • Continuous(连续概率分布)
      • Uniform(均匀分布)
      • Normal/Gaussian(正态分布)
      • Exponential(指数分布)
      • Gamma分布
      • Beta分布
      • Gumbel分布

离散概率分布

Discrete Uniform(离散均匀分布)

  • Definition:每次抽样存在多种可能结果,每种结果出现的概率完全一致.

    即 X的 Sample Space 为 a finite set \(\large S=\{k_1, k_2, \cdots, k_n\}\),

    且 $\large \ P(X=k_i)=\dfrac{1}{n}, \ \forall \ i\ \in [1,\ n], \ i \in N $

  • Example:

    • Roll a die(掷骰子):

      • Sample Space is a finite set: \(\large S=\{1, 2, \cdots, 6\}\)
      • ELO(Equally Likely Outcomes): $P(X=i) = \dfrac{1}{6}, \ \forall i \in {1, 2, \cdots, 6} $
  • R代码:

      >>> x <- sample(c(1,2,6,8,9), 10000, prob=rep(0.2,5),replace=TRUE)
    >>> table(x)## 另一种方法:用index
    >>> idx <- runif(10000,0,5); idx <- ceiling(idx)
    >>> x <- c(1,2,6,8,9)[idx]
    >>> table(x)

Bernoulli(伯努利试验)

  • Definition: 仅存在两种可能结果一次 experiment

  • Example:

    • Toss a coin(扔硬币) ONE TIME: H(Head, 正面朝上),T(Tail, 反面朝上)

      \(P(X=H) = \pi, \ \ P(X=T) = 1- \pi\)
  • R代码:

      >>>进行1000次伯努利试验
    >>> outcome <- sample(c(“T”,”F”), 1000, prob=c(0.8, 0.2), replace=TRUE)
    >>> ot <- table(outcome)
    >>> ot <- ot/sum(ot)

Binomial

  • Definition:

    • 重复 n次独立 Bernoulli 的 概率分布就是Binomial(二项式)分布:

      • Sample Space 为 \(\large {1, 0}\),
      • 出现 \(\large 1\) 的概率是 \(\large p\),
      • \(\large n\) 次结果有 \(\large X\) 次的 \(\large 1\),
      • \(\large X\) 的可能取值范围是 $\large [1,\ n] \ of \ N $
  • Notation: 记作 \(\large X \sim B(n,p)\)

  • p.f. of \(\large Binomial\):

    \(\large P(X)= C_n^X \pi^X (1-\pi)^{n-X})\)

    \(\large C_n^X = \dfrac{n! }{(n-X)! X!}\)

  • 图形特征

    • \(\large \pi\)接近 \(\large 0.5\) 时,图形是对称的;
    • \(\large \pi\)离 \(\large 0.5\) 愈远,对称性愈差, 但随 \(\large n\) 的增大, 分布趋于对称.
    • 当 n→∞ 时,只要 \(\large \pi\) 不太靠近 \(\large 0\) 或\(\large 1\),

      当 \(\large nP\) 和 \(\large n(1-P)\) 都大于 \(\large 5\) 时, 二项分布 近似于 正态分布
    • 二项分布的图形取决于 \(\large \pi\) 与 \(\large n\) ,高峰在 \(\large \mu = n \pi\) 处
  • \(\large Binomial\) 示例1

    一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行有放回的摸球游戏。

    因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。

    这个实验有三个特点:

    1. 各次摸球是彼此独立的;每次摸球只有二种可能的结果,或黄或白;
    2. 重复进行无穷次的相互独立试验。
    3. 每次摸到黄球(或摸到白球)的概率是固定的

    具备这三点后, n次有X次摸到黄球(或白球)的概率分布就是二项分布。

  • Application:

    医学研究上的应用医学研究,很多现象的观察结果是以两分类变量来表示的,

    如阳性与阴性、治愈与未愈、生存与死亡等等。

    如果:

    • 每个观察对象, Positive结果概率均为 \(\large \pi\),Negative结果概率均为 \(\large (1-\pi)\);
    • 而且各个观察对象的结果是相互独立的,
    • 重复观察 n个人,

    发生Positive结果的人数X的概率分布为二项分布,记作\(\large B(X; n,\pi)\).

SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计分析: SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计数据分析: PROBABILITY DISTRIBUTIONS(常用概率分布)的更多相关文章

  1. 《Pro SQL Server Internals, 2nd edition》的CHAPTER 3 Statistics中的Introduction to SQL Server Statistics、Statistics and Execution Plans、Statistics Maintenance(译)

    <Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress出版年: 2016-12-29页数: 804定价: USD 59 ...

  2. 基本概率分布Basic Concept of Probability Distributions 1: Binomial Distribution

    PDF下载链接 PMF If the random variable $X$ follows the binomial distribution with parameters $n$ and $p$ ...

  3. Study note for Continuous Probability Distributions

    Basics of Probability Probability density function (pdf). Let X be a continuous random variable. The ...

  4. 关系型数据库工作原理-数据特征统计分析(翻译自Coding-Geek文章)

    本文翻译自Coding-Geek文章:< How does a relational database work>.原文链接:http://coding-geek.com/how-data ...

  5. linux统计分析流量-wireshark

    wireshark是一款带界面的开源抓包工具,可以用来对系统流量进行统计分析. 安装 由于wireshark是带界面的,所以一般在界面环境下运行,可以通过yum安装: $ yum install -y ...

  6. [Math Review] Statistics Basic: Estimation

    Two Types of Estimation One of the major applications of statistics is estimating population paramet ...

  7. Bayesian Statistics for Genetics | 贝叶斯与遗传学

    Common sense reduced to computation - Pierre-Simon, marquis de Laplace (1749–1827) Inventor of Bayes ...

  8. [转] 利用SET STATISTICS IO和SET STATISTICS TIME 优化SQL Server查询性能

    首先需要说明的是这篇文章的内容并不是如何调节SQL Server查询性能的(有关这方面的内容能写一本书),而是如何在SQL Server查询性能的调节中利用SET STATISTICS IO和SET ...

  9. 利用SET STATISTICS IO和SET STATISTICS TIME 优化SQL Server查询性能

    首先需要说明的是这篇文章的内容并不是如何调节SQL Server查询性能的(有关这方面的内容能写一本书),而是如何在SQL Server查询性能的调节中利用SET STATISTICS IO和SET ...

  10. SQL Server里等待统计(Wait Statistics)介绍

    在今天的文章里我想详细谈下SQL Server里的统计等待(Wait Statistics),还有她们如何帮助你立即为什么你的SQL Server当前很慢.一提到性能调优,对我来说统计等待是SQL S ...

随机推荐

  1. C# 线程基础——用户模式、内核模式

    C# 线程基础--用户模式.内核模式 参照:用户模式和内核模式 - Windows drivers | Microsoft Docs 基础概念 运行 Windows 的计算机中的处理器有两个不同模式: ...

  2. java设置权限过滤器--防止用户未登录访问某些页面

    话不多说,上代码!!! package com.store.web.filter; import java.io.IOException; import javax.servlet.Filter; i ...

  3. 【代码】Processing笔触手写板笔刷代码合集(包含流速、毛笔笔触、压感笔触等多种)

    代码来源于openprocessing,考虑到国内不是很好访问,我把我找到的比较好的搬运过来! @ 目录 合集1 笔触4(流速笔触,速写) 笔触5(流速笔触,晕染) 笔触6(流速笔触,毛笔) 合集2 ...

  4. 【笔记】reko 0.10.2 反编译工具安装和使用记录|(1) README.md

    (翻译自README.md,并通过自己的实际操作情况重新整理了一遍) 笔者注:我已经成功地根据README.md下载了Release版本,也自己试了下从源码编译,跟着README都挺顺利的.如果操作过 ...

  5. 爬虫入门(urllib与requests)

    urllib与requests 一.urllib的学习 学习目标 了解urllib的基本使用 1.urllib介绍 除了requests模块可以发送请求之外, urllib模块也可以实现请求的发送,只 ...

  6. 堆叠、MLAG、VPC、VSS 技术对比及架构建议

    堆叠.MLAG.VPC.VSS 技术对比及架构建议 1. 堆叠(Stacking) 技术实现: 多台物理设备通过专用堆叠线缆(如华为的Stack.华三IRF.思科StackWise)或普通光纤/以太网 ...

  7. vue3 基础-常用模板语法

    一个 vue 的单文件 SAP ( single page web application ) 即在一个 .vue 为后缀的文件中, 会包含3个部分. 模板: html 逻辑: javascript ...

  8. Pandas 批量处理文本表

    就是一个批量读取文件, 然后计算指标的过程. 难度到是没啥, 只是想记录一把, 毕竟这类的需求, 其实还是蛮多的. 但涉及一些数据的安全, 和指标这块也是不能透露的, 因此只能是贴上代码, 目的还是给 ...

  9. Flutter制作桌面图标长按展示操作项面板

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 15px; o ...

  10. 解决ZYNQ-7020开发板使用vitis编译uboot报错和无法正常调试的问题

    整个学习过程是参考正点原子启明星开发板的2020.2版本嵌入式Linux开发指南,在学习uboot移植的时候遇到了问题. 新建工程和配置环境啥的和教程里都一样,就不罗嗦了,这里重点讲和教程不一样的地方 ...