R.A.定义:

R.A.(回归分析)是一种统计学方法:

用于研究变量间的关系,特别是确定一个或多个自变量一个因变量之间的定量关系

R.A. 不仅揭示变量间的关系,还能进行预测和假设检验

类型Linear+Logistic

主要类型包括Linear R.A.Logistic R.A.

  • Linear R.A.(线性回归) 适用于定量数据,用于预测和分析连续变量之间的关系

    关键步骤包括F检验(验证模型整体显著性)、R²(模型拟合优度,值越大越好)、VIF(检查多重共线性,应小于10,理想小于5)以及p值(判断变量影响的显著性)。
  • Logistic R.A.()逻辑回归) 用于分类数据,特别是二元分类(如0和1)或多分类问题,研究变量间非线性关系,常用于预测事件发生的概率

建模

建模时,需考虑变量的类型(内生与外生)控制变量,并通过理论建模实证建模估计参数

变量间常见的关系有两类:

  • 确定性关系:变量间的关系是完全确定的,可用函数 y=ƒ(x) 来表示,x(可以是向量)给定后, y的值就唯一确定了。譬如正方形的面积 S 与边长a之间有确定性关系: S=a2, 电路上有欧姆定律 V=IR等.
  • 相关关系:变量间有关系,但是不能用函数来表示. 譬如人的身高 h 和体重 w 两者间有相关关系, 一般身高 h 较高的人体重 w 也较重, 但是同身高的人的体重可以是不同的, 医学上就利用 身高h和体重w的相关关系,给出一些“经验公式”来确定一个人的是否过于“胖瘦”和“高矮”;人的 脚掌长度 θ 与 身高 h 也有相关关系。

Regression Analysis研究“变量与变量之间相关关系:尽管不能用完全确定的函数形式表示,但是在平均意义上有一定的定量关系表达式。回归分析的主要任务就是寻找这种在平均意义上的一定的定量关系表达式

回归函数的估计:Regression Analysis通过对客观事物中变量的大量观察或试验获得的数据,寻找隐藏在(Quantitative定量与现象)数据幕后的相关关系表达形式(Quanlitative定性law规律)

Regression Model

设 y 与 x 间有相关关系,称 x自变量(预报变量)y因变量(相应变量),在给定 x 的取值后,y的取值并不是固定的,y是一个随机变量,有其分布。

给定的自变量及其值为条件时,因变量是随机变量有其分布及特征数包括均值,而且因变量的均值与自变量的值有确定性的关系即可用函数表示, 这便是y关于x的回归函数Regression Function, 也就是我们要寻找的相关关系的表达式。

常见的Regression Model有两种:

  1. 第一种是 x自变量是随机变量(定义域是随机事件集合), y因变量也是随机变量 的场合,

    y因变量的分布是在给定的自变量 条件X 及其 条件值x后,Y的条件密度函数Ρ(y|x),我们关心的是因变量y的均值Ε(Y|x), 他是因变量 x 的函数,这个函数是“确定性的”:

    ,他们间关系可用表达式:  ƒ(x) = E(Y|x) = ∫y•p(y|x) dy 表示, 即 y关于 x的Regression Function回归函数,在 x自变量和 y因变量均为随机变量时也可称为Conditional Expectation条件期望

  2. 第二种是 x自变量是可控变量(定义域是连续实数集合), 只有 y因变量是随机变量,他们间关系可用表达式: y =ƒ(x) + ε 表达,其中ε是随机误差,常假设 ε∼N(0, σ2)
    由于ε的随机性导致y成为随机变量,

N(μ, σ2):, μ是均值, σ是标准差的Normal Distribution正态分布。

ε∼N(0, σ2): “ε满足均值为0,方差为σ2或标准差为σ的Normal Distribution”

进行Regression Analysis,首先是Form selection of Regression Function回归函数形式的选择.

Regression Analysis实例: 英国生物学家兼统计学家Galton的父子身高遗传研究:

Galton 观察了1078对父子,用x表示父亲身高, y表示成年儿子的身高, 发现将(x,y)画在直角坐标系中, 这1078个点基本在一条直线附件, 并求出该直线的方程(单位:inch):

ȳ = 33.73 + 0.516•x (slope=0.516)

这表明:

  • 父亲身高每增加一个单位,其儿子身高平均增加0.516个单位;(slope > 0)
  • 父辈身高越高其子辈平均身高也高, 但子辈身高的差距低于父辈间的身高差距.(slope < 1)

同时我们可总结得Single Variable Regression Analysis(一元变量回归分析)的方法之一:通常可采用“画散点图”的方法

变量间关系•R.A.(Regression Analysis)·Linear+Logistic•LSE:最小二乘估计的更多相关文章

  1. R数据分析:变量间的非线性关系,多项式,样条回归和可加模型

    之前的文章中都是给大家写的变量间线性关系的做法,包括回归和广义线性回归,变量间的非线性关系其实是很常见的,今天给大家写写如何拟合论文中常见的非线性关系.包括多项式回归Polynomial regres ...

  2. [ML学习笔记] 回归分析(Regression Analysis)

    [ML学习笔记] 回归分析(Regression Analysis) 回归分析:在一系列已知自变量与因变量之间相关关系的基础上,建立变量之间的回归方程,把回归方程作为算法模型,实现对新自变量得出因变量 ...

  3. NLP之基于BERT的预测掩码标记和句间关系判断

    BERT @ 目录 BERT 程序步骤 程序步骤 设置基本变量值,数据预处理 构建输入样本 在样本集中随机选取a和b两个句子 把ab两个句子合并为1个模型输入句,在句首加入分类符CLS,在ab中间和句 ...

  4. UML(一) 类图及类间关系

    原创文章,同步发自作者个人博客,http://www.jasongj.com/uml/class_diagram/ UML类图 UML类图介绍 在UML 2.*的13种图形中,类图是使用频率最高的UM ...

  5. 设计模式之UML类图以及类间关系

    类图是描述系统中的类,以及各个类之间的关系的静态视图.能够让我们在正确编写代码以前对系统有一个全面的认识.类图是一种模型类型,确切的说,是一种静态模型类型.类图表示类.接口和它们之间的协作关系. 以下 ...

  6. Functional mechanism: regression analysis under differential privacy_阅读报告

    Functional mechanism: regression analysis under differential privacy 论文学习报告 组员:裴建新   赖妍菱    周子玉 2020 ...

  7. 深入理解 Laravel Eloquent(三)——模型间关系(关联)

    Eloquent是什么 Eloquent 是一个 ORM,全称为 Object Relational Mapping,翻译为 "对象关系映射"(如果只把它当成 Database A ...

  8. [UML]UML中几种类间关系

    UML中类间关系主要有六种,分别是继承.实现.依赖.关联.聚合.组合 1.继承 继承是指A类继承B类,继承它private除外的所有属性和方法,这种关系是最常见的关系,在java中使用extends表 ...

  9. python函数参数是值传递还是引用传递(以及变量间复制后是否保持一致):取决于对象内容可变不可变

    函数参数传递本质上和变量整体复制一样,只是两个变量分别为形参a和实参b.那么,a=b后,a变了,b值是否跟着变呢?这取决于对象内容可变不可变 首先解释一下,什么是python对象的内容可变不可变? p ...

  10. Regression Analysis Using Excel

    Regression Analysis Using Excel Setup By default, data analysis add-in is not enabled. Follow the st ...

随机推荐

  1. c#使用内存映射像处理内存一样去快速处理文件

    在 .NET Core 中,`System.IO.MemoryMappedFiles.MemoryMappedFile` 类提供了对内存映射文件的支持.通过将文件映射到内存,你可以在应用程序中直接访问 ...

  2. 一个开源、经典的 WPF 控件、组件和实用工具集合,值得参考学习!

    前言 今天大姚给大家推荐一个开源.经典的 WPF 控件.组件和实用工具集合,对于想要自己编写 WPF UI 界面的同学可以参考借鉴学习:Extended.Wpf.Toolkit. 项目介绍 Exten ...

  3. Web客户端开发

    Web开发工具 从高层次来看,可以将客户端工具放入以下三大类需要解决的问题中: 安全网络 - 在代码开发期间有用的工具. 转换 - 以某种方式转换代码的工具,例如将一种中间语言转换为浏览器可以理解的 ...

  4. 在 .NET 中使用 Sqids 快速的为数字 ID 披上神秘短串,轻松隐藏敏感数字!

    前言 在当今数字化时代,数据的安全性和隐私性至关重要.随着网络应用的不断发展,数字 ID 作为数据标识和访问控制的关键元素,其保护显得尤为重要.然而,传统的数字 ID 往往直接暴露了一些敏感信息,如顺 ...

  5. 操作系统 -- SLAB如何分配内存

    在Linux系统中比页更小的内存对象要怎么分配呢? -- SLAB,学习下SLAB分配器的原理和实现 SLAB 与Cosmos物理页面管理器一样,Linux中的伙伴系统是以页面为最小单位分配到,现实更 ...

  6. C#之BitConverter.ToInt16

    byte[] bytes = { 1,3 }; short s = BitConverter.ToInt16(bytes,0); Console.WriteLine(s); 从低位到高位填充: 000 ...

  7. HarmonyOS运动开发:如何绘制运动速度轨迹

    前言 在户外运动应用中,绘制运动速度轨迹不仅可以直观地展示用户的运动路线,还能通过颜色变化反映速度的变化,帮助用户更好地了解自己的运动状态.然而,如何在鸿蒙系统中实现这一功能呢?本文将结合实际开发经验 ...

  8. AI生成应用:图片批量重命名工具 - 自动化整理您的图片库

    图片批量重命名工具 - 自动化整理您的图片库 GitHub项目地址: https://github.com/dependon/renameImage 项目介绍 这是一个基于Python开发的图形界面工 ...

  9. UVW源码漫谈(一)

    博客园是个非常好的学习知识的地方,相信有很多人跟我一样,园龄3年,从博客园不知道拷了多少代码,看了多少博客,自己却一篇博客都没写过.真是罪过. 这次准备写几篇关于这个项目源码的阅读和理解的文章,大家一 ...

  10. ArkUI-X应用工程结构说明

    简介 本文档配套ArkUI-X,将OpenHarmony ArkUI开发框架扩展到不同的OS平台,比如Android和iOS平台,让开发者基于ArkUI,可复用大部分的应用代码(UI以及主要应用逻辑) ...