SciTech-BigDataAIML-Statistical Model

Bayes Inference-数据/事实 ∩ 假设

\(\large \begin{array}{rl} \\
P(H|D) &=\dfrac{P(H)×P(D|H)}{P(D)} \\
H :& Hypothesis or Belief and Judgement \\
D :& Data/Reality \\
P(D \bigcap H): & probability \text{ of the } connection \text{ between }D\text{ and }H \\
\end{array}\)

注意点:

0.社会的政治经济斗争, 本质影响"数据/信念";

大多数数据/信念, 是社会现实的表现, 本质是各种力量斗争.

运用好统计概率可以科学的发现与总结事实幕后的客观规律,

更好指导经济、政治、科学研究以及社会生活方方面面。

  1. 真科学能通过历史、现在和未来检验.

    而这些都是理论(书文字, 语音视频)、经历(事实经验)、人(理解与运用)等

    多方面的统一。

  2. 每一个人都有其信念, 而且每个信念的"客观度"(科学度)不同.

    人信念都有"主观", 由每个人"自我立场/关系/利益/"影响判断.

    • 为透过"人们"的"主观", 由事实/数据, 挖掘幕后科学规律时:

      对重大事件成立"专案组",组织一群人有"计划"的,

      对每一条"数据/事实"进行 筛选, 分析,检验(含交叉).

      例如:侦破大案要案, 与审计重大财务案, 就是这种方法。
    • 有一组数据/事实\(\large \{D_1,D_2,... D_m\}\)由专案处理, 并且可能会动态增减,

      专案组得到一组假设$\large {H_1,H_2,...H_n}$, 并且可能动态增减.
    • 但是在每一阶段可视为$\large m \(条数据/事实, 与\)\large k \(人的专案组 作出\)\large n \(种假设:
      则\)\large {D_1,D_2, \cdots, D_m} \times {H_1,H_2, \cdots, H_n}\(的 每一个元素\)\large P(D_i|H_j)$
  3. P(D)是数据或事实; 而不称"证据",

    称"数据"体现"客观科学的研究态度"

    因为数据经过检验修正, 才可能称为"证据".

  4. H 是Hypothesis(假设 或 信念).

    \(\large P(HID)=( P(H)×P(D|H) ) / P(D)\)

    注意:

    • 因为 \(\large P(D|H) \leq 1 \text{ and }P(H|D) \leq 1\)

      • \(\large P(D \bigcap H) = P(H) \times P(D|H) \bm{ < P(H) }\)
      • \(\large P(D \bigcap H) = P(D) \times P(H|D) \bm{ < P(D) }\)
    • \(\large P(D)\) 表示数据/事实原本的概率,

      用"Freq.","Theoritical"或"Subjective"得出

Types of Bayes Inference

1.同一数据D, 不同假设: H1和H2,

则可只对比 Bayes公式 右式的"分子" P(H)×P(D|H),

即 P(H1)×P(D|H1) 与 P(H2)×P(D|H2),

每一种H的先验概率 与其 对数据解释能力.

或每一种H与D同时发生的概率。

是因为:P(D∩H) = P(H)×P(D|H)

  1. 不同数据D1和D2, 同一假设H
  2. 不同数据D1和D2, 不同假设H1和H2
  3. 多份数据{Di}, 多份假设{Hi}

Bayes Theorem

\(\large \begin{array}{rl} \\
P(H|D) &=\dfrac{P(H)×P(D|H)}{P(D)} \\
H :& Hypothesis or Belief and Judgement \\
D :& Data/Reality \\
P(D \bigcap H): & probability \text{ of the } connection \text{ between }D\text{ and }H \\
\end{array}\)

  • P(H): 先验概率,

    看到数据前, "我们认为"假设发生的概率

    "我们"对Hypothesis(假设)的主观概率

  • P(D|H): 似然,

    如果Hypothesis为真,得到现有数据的概率

    Hypothesis(信念)解释数据的能力

  • P(H|D): 后验概率,

    给定数据,"我们认为"Hypothesis发生概率

  • One Example:

    D = 窗外有光,天空有碟状飞行物;

    H = 天空出现一个UFO

    1. 观察数据(称数据而非证据, 客观事实):

      收集数据点,

      D1 = 窗外有光,天空有碟状飞行物;

    2. 提出假设:

      H1 = 天空出现一个UFO

      以 H 成立为条件, P(D1|H1) >> P(D1)

      表示一个假设/信念 解释数据的能力

    3. 更新信念: 需要Bayes公式

      • P(H1): 对一个信念H的先验概率
      • P(D|1H1): 信念/假设 解释数据 的能力/概率
      • P(D1∩H1): 信念/假设与数据/证据同时发生
      • P(D1∩H1) / P(D1):

        表示用P(D1)归一化后,

        得到P(H1|D1)的后验概率
    4. 持续收集数据/事实

      列出Data为行, Hypothesises为列矩阵, 用矩阵分析每对(D,H)二维坐标的概率

      注意(D1|H1), P(D2|H2),...,P(Dn|Hn) 即对角线上坐标,

      因为每一步的\(\large H_{i}\), 都是基于之前已有的所有数据集\(\large D_{i-1}\)和假设\(\large H_{i-1}\),

      所以可以构造出 对角线上坐标的概率 普遍比其他的坐标的 概率高.

      甚至可以构造出特殊的“对角矩阵”。

    5. 例如:

      H2 = 有人在窗外拍电影

      D2 = 有电线吊碟状物, 有摄影人员和灯光组

      P(D2|H2) >> P(D2|H1)

      而且当新的数据出现时,

      新假设比最初假设, 解释能力或可信度更强;

      于是大多数人们, 会根据更多数据改变信念.

      但这种行为,是不是“客观科学”?

      假设,

      • 1条评论评价一个商品 "5分", 少数人认为可信;
      • 1000条评论评价同一个商品"5分", 更多人认为可信;
      • 是不是这个"商品"就真的"5分"?

        这与"从众效应"有什么不同?
      • 事实上一些商家通过"刷评论"或"信用"提高"点击和购买率"推高营业额。

        但这不是"Bayes公式"的问题, Bayes Theorem本身没问题。

        而是 少数商家通过"欺诈"操控"客户"的"Subjective"主观认知。
      • 怎么,找出每一个商品的"客观评价"?
      • 同时,这给我们一个启示:科学本身是经过历史检验和证明的

        但是“社会人”运用科学, 有不同的"认知","立场"及"利益"等多方面因素.

        科学就是我们政治经济与社会斗争的强大武器之一
      • 当然,还有教科书上的"Statistic Swindle"和Schemes经典案例。
    6. 在以上Bayes公式, 如果 P(D)(右式分母)不易计算,

      但我们可以通过对比分子上的项, 就是 先验概率 和 似然概率 的乘积,

      来比较哪一个信念(假设)更更有可信度。然后, 一步步根据数据更新信念。

    7. 于是人们会根据更多的"数据", 综合判断, 更新这一系列信念的"概率";

SciTech-BigDataAIML-Statistical Model-Bayes Inference-数据/事实 ∩ 假设: 政治经济、社会和科学分析的更多相关文章

  1. machine learning model(algorithm model) .vs. statistical model

    https://www.analyticsvidhya.com/blog/2015/07/difference-machine-learning-statistical-modeling/ http: ...

  2. 利用泛型和反射,管理配置文件,把Model转换成数据行,并把数据行转换成Model

    利用泛型和反射,管理配置文件,把Model转换成数据行,并把数据行转换成Model   使用场景:网站配置项目,为了便于管理,网站有几个Model类来管理配置文件, 比如ConfigWebsiteMo ...

  3. MVC5中Model层开发数据注解 EF Code First Migrations数据库迁移 C# 常用对象的的修饰符 C# 静态构造函数 MSSQL2005数据库自动备份问题(到同一个局域网上的另一台电脑上) MVC 的HTTP请求

    MVC5中Model层开发数据注解   ASP.NET MVC5中Model层开发,使用的数据注解有三个作用: 数据映射(把Model层的类用EntityFramework映射成对应的表) 数据验证( ...

  4. thymeleaf的内联th:inline(在javascript访问model中的数据)

    thymeleaf模板引擎为前端数据的获取提供了较大的便利,在html标签内可通过th标签加${}表达式访问model里的对象数据.但如果不想通过th标签而是简单地访问model对象数据,或是想在ja ...

  5. 介绍了Apache日志文件每条数据的请意义以及一些实用日志分析命令

    这篇文章主要介绍了apache日志文件每条数据的请意义,以及一些实用日志分析命令,需要的朋友可以参考下(http://wap.0834jl.com) 一.日志分析 如果apache的安装时采用默认的配 ...

  6. MVC5中Model层开发数据注解

    ASP.NET MVC5中Model层开发,使用的数据注解有三个作用: 数据映射(把Model层的类用EntityFramework映射成对应的表) 数据验证(在服务器端和客户端验证数据的有效性) 数 ...

  7. A Statistical Model for Scientific Readability-paper

    Authors: Luo SiCarnegie Mellon University, Pittsburgh, PA Jamie CallanCarnegie Mellon University, Pi ...

  8. Oracle Data Integrator 12c-模型(Model)和 数据存储(DataStore)

    一.概念 Model模型: 描述关系型数据的模型. 是一组存放在特定的技术(如Oracle)的数据存储的集合.例如当技术为Oracle时,对应于数据库的Scheme DataStore: 数据存储 一 ...

  9. EL表达式无法显示Model中的数据

    后台程序通过Debug都能正常返回数据并封装到Model中.而在前台通过EL表达式取值时却是原样输出,如${cart.num}... ///展现我的购物车 @RequestMapping(" ...

  10. 2016/05/10 thinkphp 3.2.2 ①系统常量信息 ②跨控制器调用 ③连接数据库配置及Model数据模型层 ④数据查询

    [系统常量信息] 获取系统常量信息: 如果加参数true,会分组显示: 显示如下: [跨控制器调用] 一个控制器在执行的时候,可以实例化另外一个控制,并通过对象访问其指定方法. 跨控制器调用可以节省我 ...

随机推荐

  1. Asp.net core 少走弯路系列教程(四)JavaScript 学习

    前言 新人学习成本很高,网络上太多的名词和框架,全部学习会浪费大量的时间和精力. 新手缺乏学习内容的辨别能力,本系列文章为新手过滤掉不适合的学习内容(比如多线程等等),让新手少走弯路直通罗马. 作者认 ...

  2. 区块链共识算法--PoW

    PoW算法为一种概率算法,其共识结果是临时的,随着时间推移或某种强化,共识结果被推翻的概率越来越小,最终称为事实上结果 1 研究 工作量证明(Proof Of Work,简称POW),简单理解就是一份 ...

  3. theZoo - 恶意软件分析资源库

    theZoo 是一个恶意软件分析资源库,收集了几乎所有版本的恶意软件包括(恶意软件源代码项目.二进制恶意软件程序).需要分析病毒.恶意软件的朋友可以在项目中下载某个恶意软件来分析. 功能特性 恶意软件 ...

  4. 鸿蒙版《智慧农业APP》通过华为云IoT平台实现软件硬件互联

    一.原理图 本篇不涉及硬件相关的功能开发,硬件设备使用MQTT客户端模拟,如果有硬件相关经验的可以直接使用真实硬件代替MQTT客户端. 1.华为云物联网服务器 华为云物联网平台是硬件设备端跟移动APP ...

  5. C#学习:构建一个更真实的基于LLM的简历评估系统

    前言 昨天的Demo以txt文件为例进行说明,并且评估标准写死了,跟真实的简历评估系统差别太大了.今天分享的是经过改进后更加真实的基于LLM的简历评估系统. 使用AI生成了5份不同的简历,如下所示: ...

  6. ES6中好用的方法

    1.关于扁平化数组 const deps = { 'A组':[1,2,3], 'B组':[5,8,12], 'C组':[5,14,79], 'D组':[3,64,105], } let member ...

  7. 学 Java 还是 Go 语言?这事儿很简单!

    相信很多学编程的同学都在纠结这个问题:学 Java 还是 Go 语言? 先给出省流结论,简单粗暴,就 4 个字:选 Java! 好,本期结束! 网上的讨论五花八门,有人说 Java 过时了,Go 才是 ...

  8. 2025私域运营工具攻略:9款AI+SCRM神器助你留存爆发

    私域流量的战火在2025年依旧熊熊燃烧.相比于烧钱获取公域流量,精细化运营私域用户成为越来越多企业的共识.但真正做得好的运营者都明白,留存和转化不是靠刷屏,而是靠体系和工具支撑. 这篇文章,我们将围绕 ...

  9. 开源共建 | 中国移动冯江涛:ChunJun(原FlinkX)在数据入湖中的应用

    ChunJun(原FlinkX)是一个基于 Flink 提供易用.稳定.高效的批流统一的数据集成工具.2018年4月,秉承着开源共享的理念,数栈技术团队在github上开源了FlinkX,承蒙各位开发 ...

  10. 为什么 `kubectl patch` 关闭探针不重启 Pod,重新开启却重启?

    揭秘 Kubernetes 探针机制与 Pod 不可变性的博弈 在 Kubernetes 运维中,一个常见现象引发困惑:关闭探针(如 LivenessProbe)时 Pod 不会重启,但重新启用后却可 ...