ScipyODR正交距离回归(ODR-Orthogonal Distance Regression)模块,适用于回归分析时,因变量和自变量之间存在非线性关系的情况。
它提高了回归分析的准确性和稳健性。对于需要解决非线性回归问题的科研人员和工程师来说,它具有非常重要的意义。

ODR正交距离回归模块的作用主要在于它将正交化方法和距离回归结合起来,解决了传统线性回归模型在处理非线性问题时的局限性。它通过将自变量进行正交化处理,使得因变量和自变量之间的非线性关系能够更好地被拟合出来。

1. 主要功能

scipy.odr模块针对的领域比较明确,所以不像之前介绍的模块有那么多函数。
此模块的主要函数包括:

函数名 说明
Data 要拟合的数据
RealData 数据的权重为实际标准差和/或协方差
Model Model 类存储有关您希望拟合的函数的信息
ODR ODR 类收集所有信息并协调主要拟合例程的运行
Output 输出类存储 ODR 运行的输出
其他函数 调整拟合和模型的一些函数

一般来说,使用前5个函数,就可以进行一些正交距离回归分析。

2. 使用示例

正交距离分析一般步骤如下:

2.1. 准备数据

数据采用以前收集的江苏省人口数据,获取地址:https://databook.top/jiangsustat/renkou

import pandas as pd

data = pd.read_csv("/path/to/人口-年末常住人口(万人).csv")
data.head(10)


一共31条数据,1990年~2020年江苏省的人口变化数据。

用散点图看看数据的变化趋势:

from matplotlib.ticker import MultipleLocator
import matplotlib.pyplot as plt ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江苏省人口变化") plt.show()

2.2. 创建模型

使用scipy.odr模块中的Model函数创建一个拟合的模型。

import scipy.odr as sodr

# 模型函数
def model_func(p, x):
k, b = p
return k * x + b model = sodr.Model(model_func)

2.3. 生成数据

将上面的人口数据data转换为可以用于ODR运算的数据。

# x是数据
x = range(len(data)) # 转换数据用RealData或者Data函数都可以
rdata = sodr.RealData(x, data["value"])
# rdata = sodr.Data(x, data["value"])

DataRealData函数都是用来构造数据的。
一般来说,Data函数用来构造理论数据;
RealData函数用来构造实际数据的,且RealData中还可以设置权重。

这里没有设置权重,用哪个函数都可以。

2.4. ODR运算

有了数据和模型之后,就可以进行ODR运算了。

odr = sodr.ODR(rdata, model, beta0=[0, 1])

result = odr.run()
result.pprint()
# 运行结果:
Beta: [ 61.01340781 6724.77566283]
Beta Std Error: [ 1.11208495 19.3974215 ]
Beta Covariance: [[ 1.51592414 -22.73886321]
[-22.73886321 461.20026764]]
Residual Variance: 0.8158277156001223
Inverse Condition #: 0.2520617152422754
Reason(s) for Halting:
Sum of squares convergence

其中 BetaBeta Std Error就拟合的参数值和参数的标准差。

2.5. 输出结果

根据计算结果,绘制出图形更容易理解。

# 拟合参数和参数的标准差
beta = result.beta
beta_std = result.sd_beta # 拟合的曲线
y = beta[0] * x + beta[1] # 拟合曲线的标准差上限
y_up = (beta[0] + beta_std[0]) * x + (beta[1]+ beta_std[1]) # 拟合曲线的标准差下限
y_down = (beta[0] - beta_std[0]) * x + (beta[1] - beta_std[1]) # 绘制拟合的曲线
ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江苏省人口变化") ax.plot(x, y, color="b", label="拟合曲线")
ax.plot(x, y_up, color="y", label="标准差上限")
ax.plot(x, y_down, color="g", label="标准差下限") plt.legend()
plt.show()

这就是通过ODR模块拟合的人口变化情况。

3. 总结

ODR正交距离回归之所以作为Scipy的单独模块,是因为它是一种特殊的曲线拟合方法,
它使用正交化和距离加权的最小二乘法来处理具有非线性关系的输入变量,并旨在找到最优的模型以最小化预测误差。
这与一般的曲线拟合在方法和目标上有很大的不同。

后续介绍Scipy库中的其他模块时,还会介绍其他的曲线拟合函数,到时候可以和这里的ODR方法对照比较一下。

【scipy 基础】--正交距离回归的更多相关文章

  1. SciPy 基础功能

    章节 SciPy 介绍 SciPy 安装 SciPy 基础功能 SciPy 特殊函数 SciPy k均值聚类 SciPy 常量 SciPy fftpack(傅里叶变换) SciPy 积分 SciPy ...

  2. 【机器学习基础】逻辑回归——LogisticRegression

    LR算法作为一种比较经典的分类算法,在实际应用和面试中经常受到青睐,虽然在理论方面不是特别复杂,但LR所牵涉的知识点还是比较多的,同时与概率生成模型.神经网络都有着一定的联系,本节就针对这一算法及其所 ...

  3. Python教程:进击机器学习(五)--Scipy《转》

    Scipy简介 文件输入和输出scipyio 线性代数操作scipylinalg 快速傅里叶变换scipyfftpack 优化器scipyoptimize 统计工具scipystats Scipy简介 ...

  4. SciPy 介绍

    章节 SciPy 介绍 SciPy 安装 SciPy 基础功能 SciPy 特殊函数 SciPy k均值聚类 SciPy 常量 SciPy fftpack(傅里叶变换) SciPy 积分 SciPy ...

  5. 1.5 Scipy:高级科学计算

    sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&am ...

  6. 统计学习方法 | 第1章 统计学习方法概论 | Scipy中的Leastsq()

    Scipy是一个用于数学.科学.工程领域的常用软件包,可以处理插值.积分.优化.图像处理.常微分方程数值解的求解.信号处理等问题.它用于有效计算Numpy矩阵,使Numpy和Scipy协同工作,高效解 ...

  7. SciPy笔记

    一.简介 SciPy 是一个开源的 Python 算法库和数学工具包.Scipy 是基于 Numpy 的科学计算库,用于数学.科学.工程学等领域,很多有一些高阶抽象和物理模型需要使用 Scipy.Sc ...

  8. python---scipy模块

    一  简单介绍 SciPy是基于NumPy开发的高级模块,它提供了许多数学算法和函数的实现,用于解决科学计算中的一些标准问题.例如数值积分和微分方程求解,扩展的矩阵计算,最优化,概率分布和统计函数,甚 ...

  9. scikit-learn(1) 第一个例子说明

    第一个 scikit-learn例子 ................................................................................. ...

  10. .net core(c#)拟合圆测试

    说明 很多时候,我们需要运动物体的转弯半径去描述其机器性能.但在大多数的现实条件下,我们只能够获取到运动物体的 GPS 位置点集,并不能直接得到转弯半径或者圆心位置.为此,我们可以利用拟合圆的方式得到 ...

随机推荐

  1. CSS:粘性定位 使正文标题置顶

    案例效果 关键代码 代码 <!DOCTYPE html> <html lang="en"> <head> <meta charset=&q ...

  2. UE源码分析:Slate 类鼠标输入处理

    序言 UE4.25版本 本章看一下UE的 "类鼠标"输入处理(其实就是鼠标和触摸的输入,我也没找到专门的术语来代指,英文UE用的是PointerXXX),主要是按下.移动.抬起等相 ...

  3. docker安装phpmyadmin

    下载docker镜像 docker pull phpmyadmin/phpmyadmin 创建容器 # 假设MySQL服务器的地址为:192.168.0.10,端口3306 # 通过3360端口访问p ...

  4. JavaScript 基础(1) - 笔记

    1 JavaScript基础 1.1 JavaScript 是什么 1.JavaScript(是什么?) 是一种运行在客户端(浏览器)的编程语言,实现人机交互效果. 2.作用(做什么?) 网页特效(监 ...

  5. js判断h5页面地址的打开方式(微信、pc、移动端)

    1 function isOpenMode(){ 2 //平台.设备和操作系统 3 var system = { 4 win: false, 5 mac: false, 6 xll: false, 7 ...

  6. 使用kube-bench检测Kubernetes集群安全

    目录 一.系统环境 二.前言 三.CIS (Center for Internet Security)简介 四.什么是Kube-Bench? 五.使用kube-bench检测不安全的设置 5.1 手动 ...

  7. 深入理解MySQL:数据类型、查询优化、索引、事务处理和数据备份与恢复

    摘要: MySQL 是一种常用的关系型数据库管理系统,对于开发者和数据库管理员来说,掌握 MySQL 的关键概念和最佳实践非常重要.本文将围绕 MySQL 的数据类型.查询优化.索引.事务处理以及数据 ...

  8. python flask 简单应用开发

    转载请注明出处: Flask 是一个基于 Python 的微型 Web 框架,它提供了一组简洁而强大的工具和库,用于构建 Web 应用程序.Flask 的主要作用是帮助开发者快速搭建轻量级的.灵活的 ...

  9. 我愿称之为"温水煮青蛙"

    前言:作为开发在工作中如何将自己一点一点放弃. 事情是这样的,来新公司已经差不多三个多月了,公司的主要技术栈大部分还是jquer 这让我非常的头疼,不是说做不了这个技术,其实用过jquer 都知道这玩 ...

  10. 如何通过抖音订单API接口获取订单详情

    要通过抖音订单API接口获取订单详情,您需要进行以下步骤: 1.获取Access Token:使用APP ID和APP Secret调用获取Access Token API接口来获取您的Access ...