词汇

MI(Mobile Internet): 移动互联网

IoT(Internet of Things): 万物互联网

WE(Word Embedding): 词嵌入

PE(Positional Encoding): 位置编码

整体和局部是统一的

例如人类历史,

  • 民族和国家的发展的规律 与 当时的人的特征是 统一的;

    *“整体的规律”与“局部人的生产生活规律”的统一性,得到强化 。

    特别是当今的MI(移动互联)、IOT(万物互联) 和BigData(大数据)、AI(人工智能)的时代.

    整体规律 与 局部规律 的统一被强化的根本原因,

    是整体和局部之间的, 政府作为。

AI(统计模型)与BigData的源头是"MI"和"IoT"

1 真正"改革生产生活习惯" 的是 "国家政策"与"政府"。

新经济的产生是以“改革生产生活习惯”为前提.

生产生活的习惯改变:

行政办公、经商、工作和生活 都必须用到智能设备、智能信息系统。

  • 国家教育和培训为整个行业提供充分的人力资源:

    开设新课程, 并且教育和培训出大量的AI人工智能、ML机器学习、DA数据分析、SW软件与HW硬件人才;
  • 国家政策的产业引导朝"智能化、信息化、自动化"升级换代

    即新经济的一个大方向.
  • 产业和民间资本的投融资促进自然经济的蓬勃发展。

2 人人都使用移动智能终端和智能信息系统

  • 大量的真实有效数据,是统计模型的必要条件。

    而大多数人的生活, 都在使用这些智能设备(智能手机、平板、电脑和其他设备).
  • 使得每个人都产生“大量的数据”, 为整个行业提供“实际数据";

    日夜产生源源不断的真实数据。

统计概率模型的预训练大量数据的本质:

  • 有“预训练”和“预测应用”两个阶段;

    预测应用的"规律、可信与可靠度" 由"预训练的大量数据" 与"模型本身"决定。
  • “预训练的'大量数据'”是“上确界”:

    统计概率模型(包括transformer), 预测时“用到的规律”,

    都是由“模型”总结“训练时大量数据”得到的统计规律
  • 模型本身的“选择设计(统计分析)”与“实现”也非常重要
    • 首先"模型本身"要有"够多参数与够高精度"(NN"深度神经网络"要有足够"深度")

      学习“大量数据的规律”才能保障“任何模型”的有效性。
    • 模型本身选取的“统计方法”和“实现”是研究人员决定

      例如, 常用的Linear Regression模型, CNN卷积模型于图像处理,LSTM/Transformer于NLP, ...

\(\large Supervised\ Statistical\ Model\):

\(\large Transformer+Self Attention\)

  • \(\large Supervised\ Model\): Supervised by \(\large Training\ Data\).

  • \(\large Statistical\ Model\): mainly using Probability+Statistics methods.

  • both \(\large Transformer\) and \(\large Self Attention\) are $ Supervised\ Statistical\ Model $

  • 分“训练(学习)阶段”和“预测(应用)阶段”:

    • 训练阶段: 在 "大量训练数据" 上 "学习总结事实规律"(确定模型参数),

      主流用统计概率分析方法.

      例如: \(\large Self Attention\) 训练确定最好的模型参数\(\large W^q,\ W^k, W^v\).

    • 预测阶段: 可重复使用应用"预先总结的(训练数据的)事实规律"进行快捷高效预测.

      例如: \(\large Self Attention\) 预测时,直接用训练好的 \(\large W^q,\ W^k, W^v\) 高效预测 .

  • \(\large Transformer\) 及 \(\large Self Attention\) 都是 \(\large Supervised\ Statistical\ Model\)

    是对"大量预训练数据", 用"统计概率分析等方法", 学习总结"事实规律"(确定模型参数),

    以能可重复使用应用"预先总结的事实规律"进行快捷高效预测的模型.

  • \(\large Self Attention\)预测时的"乱序计算出稳定" \(\large Attention\ Score\ Vector\) "能力

    • \(\large Self Attention\)预测用 \(\large Parameter\) 是"稳定不变"预先训练好存在模型的.

      即: 计算Word Sequence任意两个"Word"的\(\large Attention\ Score\)时, 用的 \(\large W^q,\ W^k, W^v\) 是稳定不变的训练好的模型参数.
    • 任意乱序计算稳定的" \(\large Attention\ Score\ Vector\) " 能力:

      "Word Sequence"任意重排, 得到同一 \(\large Attention\ Score\ Vector\)(如果不嵌入 \(\large PE位置信息\)).
  • \(\large Transformer\)的核心原理:

    组合使用多种"数学驱动"的先进技术:

    • \(\large Self Attention\),
    • \(\large PE(Positional\ Encoding)\),
    • \(\large WE(Word\ Embedding)\).

    实现以下多种优点:

    • 解耦"Long Sequence"(长序列)的"强顺序依赖(Word的前后位置)",
    • 可并行计算 \(\large Attention\ Score\ Vector\),
    • 可伸缩性\(\large Scalability\).

SciTech-BigDataAIML-Methodology方法论-Whole+Part整体和局部-$\large Supervised\ Statistical\ Model$统计模型和大量训练数据+Transformer核心原理+ MI移动互联+IoT万物互联-Economics经济-Politics政策的更多相关文章

  1. 数据中台核心方法论--OneModel为何需要产品化支撑?

    什么是产品化 大部分创业公司都是从一个伟大的想法创意开始的,并且需要有一堆技术专家来实现.我们清楚,伟大的技术并不等同于和伟大的产品,技术可以解决问题,但如果它没有办法法规模化,那这些技术或者能力对用 ...

  2. 论文笔记【四】Semi-supervised Word Sense Disambiguation with Neural Models

    基于神经模型的半监督词义消歧 Dayu Yuan  Julian Richardson  Ryan Doherty  Colin Evans  Eric Altendorf Google, Mount ...

  3. IOT大数据大世界大未来,物联网产业大数据应用简析

    在物联网时代,面对PB级的数据,企业将难以以一己之力完成基础设施的建设.物联网所产生的大量数据不仅会驱动现在的数据中心发生根本性的变化,同时也会驱动相关企业采用新的大数据策略. 物联网的价值在于数据: ...

  4. 【CDN】- 什么是CDN

    高冷科普: CDN,Content Delivery Network缩写,即内容分发网络.通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量 ...

  5. SIGAI机器学习第六集 决策树

    讲授决策树的基本概念,分类与回归树的原理,决策树的表示能力,决策树的训练算法,寻找最佳分裂的原理,叶子节点值的标记,属性缺失与替 代分裂,决策树的剪枝算法,决策树应用. 非常直观和易于理解的机器学习算 ...

  6. AIoT开放平台及应用

    AIoT开放平台及应用 阿里AIoT开放平台,是阿里云IoT面向开发者的能力接入渠道,开发者可以在这里完成能力的申请.开通.部署.配置和集成开发等一些列工作.这些能力并不的独立交付,而是通过关联到行业 ...

  7. ETCD相关介绍--整体概念及原理方面

    etcd作为一个受到ZooKeeper与doozer启发而催生的项目,除了拥有与之类似的功能外,更专注于以下四点. 简单:基于HTTP+JSON的API让你用curl就可以轻松使用. 安全:可选SSL ...

  8. RecyclerView源码分析(一)--整体设计

    RecyclerView这个控件出来已经有一段时间了,如果看这篇文章的你,还没有使用过这个控件.那请先去学习怎样使用.不然看也白看.这里奉上一些关于介绍RecyclerView使用方法的优秀博客: 鸿 ...

  9. Alink漫谈(十二) :在线学习算法FTRL 之 整体设计

    Alink漫谈(十二) :在线学习算法FTRL 之 整体设计 目录 Alink漫谈(十二) :在线学习算法FTRL 之 整体设计 0x00 摘要 0x01概念 1.1 逻辑回归 1.1.1 推导过程 ...

  10. CDQ分治 & 整体分治

    Part 1:CDQ分治 CDQ分治讲解博客 可以把CDQ分治理解为类似与归并排序求逆序对个数的一种分治算法(至少我现在是这么想的).先处理完左右两边各自对答案的贡献,在处理跨越左右两边的对答案的贡献 ...

随机推荐

  1. Torch-Pruning工具箱

    Torch-Pruning 通道剪枝网络实现加速的工作. Torch pruning是进行结构剪枝的pytorch工具箱,和pytorch官方提供的基于mask的非结构化剪枝不同,工具箱移除整个通道剪 ...

  2. TVM:解析TVM算子

    在对TVM:编译流程一文中,从ONNX模型中读取模型并转换为relay IR,其中调用_convert_operator函数关于将onnx算子转换成Relay算子,其中如何实现当时直接跳过去了,本节将 ...

  3. WPF 的 FlowDocumentScrollViewer滚动到最底下的方法

    官网上好像并没有直接给相应的接口和方法. 发现一种有效的方法: 先说方法: ScrollViewer sv = flowScrollViewer.Template.FindName("PAR ...

  4. 取余(rem)和取模(mod)的区别

    设 A rem B || A mod B 生成机制 取余:采取fix()函数,向0方向取整 取模:采取floor()函数,向无穷小方向取整 当A,B异号时(其实同号也是这个规律-) 取余:结果和A同号 ...

  5. 在linux下QImage和QPixmap的内存泄漏和QPixmap线程安全问题

    在linux下QImage和QPixmap的内存泄漏和QPixmap线程安全问题 为什么不在线程里面使用QPixmap(path),而是使用QPixmap::fromImage(QImage(path ...

  6. Java 批量重命名文件

      以下实例演示了使用java I/O流读取文件夹中所有的文件名,并基于for循环使用 File 类的 oldFile.renameTo(newFile) 方法批量重命名文件. import java ...

  7. jdk exe安装包如何自制zip解压版

    前言 jdk8 oracle官方下载页面 https://www.oracle.com/java/technologies/downloads/#java8-windows 可以看到,只有exe安装包 ...

  8. AtCoder Beginner Contest 357-D

    Problem For a positive integer \(N\), let \(V_N\) be the integer formed by concatenating \(N\) exact ...

  9. AtCoder Beginner Contest 341-F

    AtCoder Beginner Contest 341-F F - Breakdown Problem 给你一个由 \(N\) 个顶点和 \(M\) 条边组成的简单无向图.每个顶点拥有权重\(W_i ...

  10. Burp Suite 企业级深度实战教程

    第一部分:环境搭建与高级配置 1.1 专业版激活与插件生态 # 专业版激活(Linux) java -jar -Xmx2048m burpsuite_pro.jar --activate --acti ...