基于R语言的GD库实现地理探测器并自动将连续变量转为类别变量
本文介绍基于R语言中的GD包,依据栅格影像数据,实现自变量最优离散化方法选取与执行,并进行地理探测器(Geodetector)操作的方法。
首先,在R语言中进行地理探测器操作,可通过geodetector包、GD包等2个包实现。其中,geodetector包是地理探测器模型的原作者团队开发的,其需要保证输入的自变量数据已经全部为类别数据;其具体操作方法大家可以参考地理探测器R语言实现:geodetector。而GD包则是另一位学者开发的,其可自动实现自变量数据的最优离散化方法选取与执行;本文介绍的就是基于GD包实现地理探测器的具体操作。此外,如果希望基于Excel实现地理探测器,大家可以参考地理探测器Geodetector下载、使用、结果分析方法。
1 包的安装与导入
首先,我们可以先到GD包在R语言中的官方网站,大致了解一下该包的简要介绍、开发团队等基本信息。
随后,我们开始GD包的下载与安装。输入如下所示的代码,即可开始包的下载与安装过程。
install.packages("GD")
输入代码后,按下回车键,运行代码;如下图所示。在安装GD包时,会自动将其所需依赖的其他包(如果在此之前没有配置过)都一并配置好,非常方便。

接下来,输入如下的代码,将GD包导入。
library("GD")
输入代码后,按下回车键,运行代码;如下图所示。

2 数据读取与预处理
接下来,我们需要读取栅格图像数据,并将其转为GD包可以识别的数据框(Data Frames)格式。
其中,读取栅格数据的方法,大家参考基于R语言的raster包读取遥感影像即可;关于数据格式的转换,大家参考地理探测器R语言实现:geodetector即可。这一部分的内容本文就不再赘述。
3 地理探测器执行
接下来,我们就可以开始地理探测器的具体分析;强烈建议大家基于GD包中的gdm()函数,实现一步到位的地理探测器分析操作。
首先,如果大家输入数据中的自变量数据具有连续变量,需要将其转换为类别变量;gdm()函数可以实现连续变量的离散化方式寻优与自动执行。其中,我们可以选择的离散化方式包括相等间隔法、自然间断点法、分位数分类法、几何间隔法与标准差法等5种不同的方法,分别对应以下第一句代码中的"equal"、"natural"、"quantile"、"geometric"与"sd"等5个选项。此外,我们还可以依据数据的特征,对自变量离散化的类别数量加以限定,具体代码如下所示。
discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)
其中,上述第一句代码表示,我们后续将从相等间隔法、自然间断点法、分位数分类法、几何间隔法与标准差法等5种不同的方法中,找到每一个连续变量对应的最优离散化方法;第二句代码则表示,在后续寻找最优离散化方法的同时,还需要对每一个变量的分类数量加以寻优——c(4:10)就表示我们分别将每一个连续变量分为4类、5类、6类,以此类推,一直到10类,从其中找到最优结果对应的类别数量。
接下来,我们即可调用gdm()函数,执行地理探测器分析的具体操作;其中,my_gd为保存地理探测器结果的变量;函数的第一个参数,表示因变量与自变量的关系,~前的变量即为因变量,~后的变量即为自变量,多个自变量之间通过+相连接;第二个参数表示自变量中的连续变量,程序将自动对这些连续变量加以离散化方法寻优与执行;第三个参数表示存储自变量与因变量数据的数据框(Data Frames)格式的变量;最后两个变量,即为前面我们选择的离散化方法与类别数量。
my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
continuous_variable = c("C_SlopeS0", "D_AspectS0"),
data = tif_frame,
discmethod = discmethod,
discitv = discitv)
这里需要注意,如果大家不是通过脚本运行的R语言,而是每次写一句代码然后按下回车键运行一下,那么上述代码中的换行就需要通过同时按下Shift键与回车键实现。输入上述代码后,如下图所示。

随后,即可运行代码。稍等片刻(具体时长与数据量有关),即可得到地理探测器的结果my_gd。这一变量的具体结构、内容如下图所示。

我们可以输入如下的代码,将变量my_gd打印出来。
my_gd
所得结果如下图所示。

可以看到,my_gd变量包含了每一个连续变量在离散化后,对应的最优离散化方法与类别数量,以及地理探测器的各个分析结果。具体结果的含义与研读方法,大家参考地理探测器Geodetector下载、使用、结果分析方法,以及地理探测器R语言实现:geodetector这两篇文章即可,这里就不再赘述。
此外,我们可以通过如下的代码,将上述结果加以可视化。
plot(my_gd)
运行上述代码,结果如下图所示。

此时,在RStudio软件的右下方“Plots”中,即可看到可视化结果,如下图所示。其中,我们可以通过下图中红色方框内的箭头,实现不同图片的切换显示。

上述结果包含7张图像,其分别与上上图中的7项输出内容对应——第一张图是最优离散化方法的选取过程,第二张图则是所选出的最优离散化方法对应的分类情况;后5张图就是地理探测器的分析结果图,即上上图中最后5个plot分别对应的结果。
至此,我们就完成了基于R语言中的GD包,依据多张栅格图像数据,实现类别变量的自动离散化,并进行地理探测器(Geodetector)操作的完整流程。
基于R语言的GD库实现地理探测器并自动将连续变量转为类别变量的更多相关文章
- 概率图模型 基于R语言 这本书中的第一个R语言程序
概率图模型 基于R语言 这本书中的第一个R语言程序 prior <- c(working =0.99,broken =0.01) likelihood <- rbind(working = ...
- 基于R语言的时间序列指数模型
时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...
- 基于R语言的ARIMA模型
A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...
- Twitter基于R语言的时序数据突变检测(BreakoutDetection)
Twitter开源的时序数据突变检测(BreakoutDetection),基于无参的E-Divisive with Medians (EDM)算法,比传统的E-Divisive算法快3.5倍以上,并 ...
- [R语言] 基于R语言实现环状条形图的绘制
环状条形图(Circular barplot)是条形图的变体,图如其名,环状条形图在视觉上很吸引人,但也必须小心使用,因为环状条形图使用的是极坐标系而不是笛卡尔坐标系,每一个类别不共享相同的Y轴.环状 ...
- 中文分词实践(基于R语言)
背景:分析用户在世界杯期间讨论最多的话题. 思路:把用户关于世界杯的帖子拉下来.然后做中文分词+词频统计,最后将统计结果简单做个标签云.效果例如以下: 兴许:中文分词是中文信息处理的基础.分词之后.事 ...
- [R语言] 基于R语言实现树形图的绘制
树状图(或树形图)是一种网络结构.它由一个根节点组成,根节点产生由边或分支连接的多个节点.层次结构的最后一个节点称为叶.本文主要基于R语言实现树形图的绘制.关于python实现树形图的绘制见:基于ma ...
- 基于R语言的结构方程:lavaan简明教程 [中文翻译版]
lavaan简明教程 [中文翻译版] 译者注:此文档原作者为比利时Ghent大学的Yves Rosseel博士,lavaan亦为其开发,完全开源.免费.我在学习的时候顺手翻译了一下,向Yves的开源精 ...
- 【转】基于R语言构建的电影评分预测模型
一,前提准备 1.R语言包:ggplot2包(绘图),recommenderlab包,reshape包(数据处理) 2.获取数据:大家可以在明尼苏达州大学的社会化计算研 ...
- 机器学习-线性回归(基于R语言)
基本概念 利用线性的方法,模拟因变量与一个或多个自变量之间的关系.自变量是模型输入值,因变量是模型基于自变量的输出值. 因变量是自变量线性叠加和的结果. 线性回归模型背后的逻辑——最小二乘法计算线性系 ...
随机推荐
- react 聊聊setState异步背后的原理,react如何感知setState下的同步与异步?
壹 ❀ 引 在react中的setState是同步还是异步?react为什么要将其设计成异步?一文中,我们介绍了setState同步异步问题,解释了何种情况下同步与异步,异步带来了什么好处,以及rea ...
- JS Leetcode 213. 打家劫舍 II 题解分析,在动态规划基础上感受分治算法的魅力
壹 ❀ 引 本题来自LeetCode 213. 打家劫舍 II,难度中等,属于前面我们做过的198. 打家劫舍的升级版,难度同样为中等,题目描述如下: 你是一个专业的小偷,计划偷窃沿街的房屋,每间房内 ...
- Laravel入坑指南(12)——最终章:Session、缓存与Redis
因为web服务除了业务准确之外,我们最关注的就是服务的性能.鉴于web服务几乎都是IO密集型,我们为了提高IO的速度,自然不能把所有的数据都放在关系型数据库中.而redis的并发与性能可以很好地帮我们 ...
- Go语言的100个错误使用场景(48-54)|错误管理
目录 前言 7. 错误管理 7.1 panicking(#48) 7.2 不清楚何时应该包裹一个 error(#49) 7.3 检查错误类型不够精确(#50) 7.4 检查错误值不够精确(#51) 7 ...
- 【Android逆向】破解看雪9月算法破解第一题
1. 安装apk到手机 2. 随意输入账号和密码,点击register,报错crackme1:ERROR 3. 将apk拖入到jadx中进行观察 public native String regist ...
- gitee配置SSH公钥
第一步,找个地方打开"git bash",然后输入生成ssh公钥的命令: ssh-keygen -t rsa -C 'your-email' 然后敲四次回车生成公钥: 第二步,输入 ...
- 用Taro写一个微信小程序——Taro3路由传参
参考https://docs.taro.zone/docs/router 1.传入参数 Taro.navigateTo({ url: '/pages/page/path/name?id=2&t ...
- 【Azure 事件中心】在Windows系统中使用 kafka-consumer-groups.bat 查看Event Hub中kafka的consumer groups信息
问题描述 使用 Apache Flink 连接支持 Apache Kafka的Azure Event Hub后,由于消费端的Consumer Group是动态创建,在门户页面和Service Bus ...
- adb monkey 有哪些参数?
adb monkey 是 Android Debug Bridge (ADB) 工具中的一个命令,用于执行随机事件来对 Android 应用进行压力测试.以下是 adb monkey 命令的一些常用参 ...
- Java //手动输入3个数,并从小到大排序
1 //手动输入3个数,并从小到大排序 2 //import java.util.Sanner; 3 4 System.out.println("请输入第一个数:"); 5 Sca ...