R.A.定义:

R.A.(回归分析)是一种统计学方法:

用于研究变量间的关系,特别是确定一个或多个自变量一个因变量之间的定量关系

R.A. 不仅揭示变量间的关系,还能进行预测和假设检验

类型Linear+Logistic

主要类型包括Linear R.A.Logistic R.A.

  • Linear R.A.(线性回归) 适用于定量数据,用于预测和分析连续变量之间的关系

    关键步骤包括F检验(验证模型整体显著性)、R²(模型拟合优度,值越大越好)、VIF(检查多重共线性,应小于10,理想小于5)以及p值(判断变量影响的显著性)。
  • Logistic R.A.()逻辑回归) 用于分类数据,特别是二元分类(如0和1)或多分类问题,研究变量间非线性关系,常用于预测事件发生的概率

建模

建模时,需考虑变量的类型(内生与外生)控制变量,并通过理论建模实证建模估计参数

变量间常见的关系有两类:

  • 确定性关系:变量间的关系是完全确定的,可用函数 y=ƒ(x) 来表示,x(可以是向量)给定后, y的值就唯一确定了。譬如正方形的面积 S 与边长a之间有确定性关系: S=a2, 电路上有欧姆定律 V=IR等.
  • 相关关系:变量间有关系,但是不能用函数来表示. 譬如人的身高 h 和体重 w 两者间有相关关系, 一般身高 h 较高的人体重 w 也较重, 但是同身高的人的体重可以是不同的, 医学上就利用 身高h和体重w的相关关系,给出一些“经验公式”来确定一个人的是否过于“胖瘦”和“高矮”;人的 脚掌长度 θ 与 身高 h 也有相关关系。

Regression Analysis研究“变量与变量之间相关关系:尽管不能用完全确定的函数形式表示,但是在平均意义上有一定的定量关系表达式。回归分析的主要任务就是寻找这种在平均意义上的一定的定量关系表达式

回归函数的估计:Regression Analysis通过对客观事物中变量的大量观察或试验获得的数据,寻找隐藏在(Quantitative定量与现象)数据幕后的相关关系表达形式(Quanlitative定性law规律)

Regression Model

设 y 与 x 间有相关关系,称 x自变量(预报变量)y因变量(相应变量),在给定 x 的取值后,y的取值并不是固定的,y是一个随机变量,有其分布。

给定的自变量及其值为条件时,因变量是随机变量有其分布及特征数包括均值,而且因变量的均值与自变量的值有确定性的关系即可用函数表示, 这便是y关于x的回归函数Regression Function, 也就是我们要寻找的相关关系的表达式。

常见的Regression Model有两种:

  1. 第一种是 x自变量是随机变量(定义域是随机事件集合), y因变量也是随机变量 的场合,

    y因变量的分布是在给定的自变量 条件X 及其 条件值x后,Y的条件密度函数Ρ(y|x),我们关心的是因变量y的均值Ε(Y|x), 他是因变量 x 的函数,这个函数是“确定性的”:

    ,他们间关系可用表达式:  ƒ(x) = E(Y|x) = ∫y•p(y|x) dy 表示, 即 y关于 x的Regression Function回归函数,在 x自变量和 y因变量均为随机变量时也可称为Conditional Expectation条件期望

  2. 第二种是 x自变量是可控变量(定义域是连续实数集合), 只有 y因变量是随机变量,他们间关系可用表达式: y =ƒ(x) + ε 表达,其中ε是随机误差,常假设 ε∼N(0, σ2)
    由于ε的随机性导致y成为随机变量,

N(μ, σ2):, μ是均值, σ是标准差的Normal Distribution正态分布。

ε∼N(0, σ2): “ε满足均值为0,方差为σ2或标准差为σ的Normal Distribution”

进行Regression Analysis,首先是Form selection of Regression Function回归函数形式的选择.

Regression Analysis实例: 英国生物学家兼统计学家Galton的父子身高遗传研究:

Galton 观察了1078对父子,用x表示父亲身高, y表示成年儿子的身高, 发现将(x,y)画在直角坐标系中, 这1078个点基本在一条直线附件, 并求出该直线的方程(单位:inch):

ȳ = 33.73 + 0.516•x (slope=0.516)

这表明:

  • 父亲身高每增加一个单位,其儿子身高平均增加0.516个单位;(slope > 0)
  • 父辈身高越高其子辈平均身高也高, 但子辈身高的差距低于父辈间的身高差距.(slope < 1)

同时我们可总结得Single Variable Regression Analysis(一元变量回归分析)的方法之一:通常可采用“画散点图”的方法

变量间关系•R.A.(Regression Analysis)·Linear+Logistic•LSE:最小二乘估计的更多相关文章

  1. R数据分析:变量间的非线性关系,多项式,样条回归和可加模型

    之前的文章中都是给大家写的变量间线性关系的做法,包括回归和广义线性回归,变量间的非线性关系其实是很常见的,今天给大家写写如何拟合论文中常见的非线性关系.包括多项式回归Polynomial regres ...

  2. [ML学习笔记] 回归分析(Regression Analysis)

    [ML学习笔记] 回归分析(Regression Analysis) 回归分析:在一系列已知自变量与因变量之间相关关系的基础上,建立变量之间的回归方程,把回归方程作为算法模型,实现对新自变量得出因变量 ...

  3. NLP之基于BERT的预测掩码标记和句间关系判断

    BERT @ 目录 BERT 程序步骤 程序步骤 设置基本变量值,数据预处理 构建输入样本 在样本集中随机选取a和b两个句子 把ab两个句子合并为1个模型输入句,在句首加入分类符CLS,在ab中间和句 ...

  4. UML(一) 类图及类间关系

    原创文章,同步发自作者个人博客,http://www.jasongj.com/uml/class_diagram/ UML类图 UML类图介绍 在UML 2.*的13种图形中,类图是使用频率最高的UM ...

  5. 设计模式之UML类图以及类间关系

    类图是描述系统中的类,以及各个类之间的关系的静态视图.能够让我们在正确编写代码以前对系统有一个全面的认识.类图是一种模型类型,确切的说,是一种静态模型类型.类图表示类.接口和它们之间的协作关系. 以下 ...

  6. Functional mechanism: regression analysis under differential privacy_阅读报告

    Functional mechanism: regression analysis under differential privacy 论文学习报告 组员:裴建新   赖妍菱    周子玉 2020 ...

  7. 深入理解 Laravel Eloquent(三)——模型间关系(关联)

    Eloquent是什么 Eloquent 是一个 ORM,全称为 Object Relational Mapping,翻译为 "对象关系映射"(如果只把它当成 Database A ...

  8. [UML]UML中几种类间关系

    UML中类间关系主要有六种,分别是继承.实现.依赖.关联.聚合.组合 1.继承 继承是指A类继承B类,继承它private除外的所有属性和方法,这种关系是最常见的关系,在java中使用extends表 ...

  9. python函数参数是值传递还是引用传递(以及变量间复制后是否保持一致):取决于对象内容可变不可变

    函数参数传递本质上和变量整体复制一样,只是两个变量分别为形参a和实参b.那么,a=b后,a变了,b值是否跟着变呢?这取决于对象内容可变不可变 首先解释一下,什么是python对象的内容可变不可变? p ...

  10. Regression Analysis Using Excel

    Regression Analysis Using Excel Setup By default, data analysis add-in is not enabled. Follow the st ...

随机推荐

  1. 一文详解银河麒麟配置容器运行时及gVisor(runsc)、Kata(runv)详细指南

    容器运行时介绍 容器运行时核心概念与分类 容器运行时(Container Runtime)是管理容器生命周期(创建.启动.停止.删除)和资源隔离的核心组件,通过与操作系统内核协作实现容器化环境.根据功 ...

  2. 1K star!这个开源项目让短信集成简单到离谱,开发效率直接翻倍!

    嗨,大家好,我是小华同学,关注我们获得"最新.最全.最优质"开源项目和高效工作学习方法 "让简单的事情回归简单的本质" -- SMS4J 项目宣言 SMS4J ...

  3. edge浏览器新版,开心的扔掉chrome!还是微软更良心!windows系统全球用也没说啥!让你android能!

    直接上图吧,这下google慌了吧!微软给力呀!关键是版本直接最新的chromium!比起qq浏览器70,360浏览器78新的多了: 微软开发,质量信得过,就个人隐私之类的我更相信微软,比起googl ...

  4. 【代码】Python3|Requests 库怎么继承 Selenium 的 Headers (2024,Chrome)

    本文使用的版本: Chrome 124 Python 12 Selenium 4.19.0 版本过旧可能会出现问题,但只要别差异太大,就可以看本文,因为本文对新老版本都有讲解. 文章目录 1 难点解析 ...

  5. k8s之statefulset控制器

    operator: statefulset:有状态副本集 特点 运行在: 1,稳定且唯一的网络标识符 2,稳定且持久的存储 3,有序,平滑地部署和扩展 4,有序,平滑地删除和终止 5,有序的滚动更新 ...

  6. C# AggreateException

    在 C# 中,AggregateException 是一种特殊类型的异常,它允许在多个异步任务中捕获并组合多个异常.当在一个异步任务中同时执行多个子任务时,如果其中任何一个子任务抛出了异常,那么父任务 ...

  7. openjdk8下载地址(附赠)

    openjdk下载地址:https://jdk.java.net/ (文末已经为大家下好了,放在网盘里) 进去后点8,win. 安装好后,使用java -version命令如下: 成功安装openjd ...

  8. MySQL设置字符集、排序规则和区分字母大小

    摘要:在MySQL中,设置字符集和排序规则,在查询时区分字母大小写,utf8mb4支持emoji表情,而utf8不支持. 问题综述   在工作中,设置的一些唯一标志字符串和登录密码都是区分大小写的,但 ...

  9. 利用堆排序和分治法求解千万级数据排序的Top K问题—百度面试

    目录 问题描述 问题解析 第一步:查询次数统计 第二步:找出Top 10 算法一:排序 算法二:部分排序 算法三:堆排序 1.构造初始堆 2.首尾交换,断尾重构 3.迭代执行第二步 算法四:分治法 小 ...

  10. 【2020.11.25提高组模拟】树的解构(deconstruct) 题解

    [2020.11.25提高组模拟]树的解构(deconstruct) 题解 题目描述 给一棵以\(1\)为根的外向树,进行\((n-1)\)次删边操作,每次都会从没有删掉的边中等概率地删掉一条边\(a ...