本章会从 R 语言中最基本的数据类型开始介绍,在此之后就可以开始 R 语言实践了。对社交网络分析而言,我们在处理字符串上所花费的时间要远远大于处理数字的时间,因此本章还会介绍常用的字符串处理操作。

变量

R 语言中基本的数据类型包括:

  1. 整型(integer):整数,如 100
  2. 浮点型(double):小数,如 3.14
  3. 字符串型(character):R 语言中的字符串可以使用 " 或者 ' 定义,如 "abc"'abc'
  4. 逻辑型(logical):其他编程语言中常称为布尔型,在 R 语言中使用严格区分大小写的 TRUEFALSE 表示,或者使用缩写 TF

提示

R 语言中还存在数值型 numeric,可以看作整型和浮点型的并集。

变量就是对数据类型的引用,比如有一个整型值 100,想在程序中使用它并用 a 来表示,将 100 赋值给 a 后(a <- 100),a 就称之为变量。R 语言对变量的定义并不像强类型的语言一样需要在定义变量时声明变量的数据类型。当进行赋值操作时,就定义了一个新的变量。下面这段程序就是声明了一个变量 a,并且将 100 赋值给了变量 a,这三行代码的操作是等价的:

a <- 100
a = 100
100 -> a

在 R 语言中标准的赋值符号为 <-,这其中包含两个字符 <-。当然也可以使用 = 进行代替。从上面的代码也可以观察到,赋值符号 <- 是有方向性的,指向被赋值的对象。

变量的名称不是随意的,一个有效的变量名由字母开头,后面跟上任意数量的字母,数字以及下划线。下面是一些合法的变量名:aa1a_ba.b。下面是一些非法的变量名称:11a_a。当然,也不要使用关键字作为变量名,关键字是用于描述 R 语言的语法的。

提示

下面给出一些特殊的运算符:

运算符 描述 示例 输出
^ 乘方 2^3 8
%% 求余 3 %% 2 1
%/% 整除 5 %/% 2 2

字符串

字符串的创建

R 语言中的字符串既可以使用双引号 " 定义,也可以使用单引号 ' 定义。但是为什么要使用两种引号定义字符串?

> '这是包含"双引号"的字符串'
[1] "这是包含\"双引号\"的字符串" > "这是包含'单引号'的字符串"
[1] "这是包含'单引号'的字符串"

这样做的好处是可以在不转义引号的情况下,创建本身就包含引号的字符串。可以在双引号 " 定义的字符串中使用单引号 ',也可以在单引号 ' 定义的字符串中使用双引号 "

使用 as.character() 可以将其他的数据类型转换成字符串:

> as.character(3.14)
[1] "3.14" > as.character(T)
[1] "TRUE"

特殊字符的转义

转义是指输出具有特殊意义的字符,比如想要在双引号定义的字符串中使用双引号,或者在字符串中使用换行操作。和大多数语言一样,R 语言中使用反斜杠 \ 进行转义操作,常见的转义字符有换行符 \n,引号 \" \',以及对反斜杠本身进行转义 \\

> writeLines("Use \"double quotation\" in a string")
Use "double quotation" in a string > writeLines("Use line breaks\nin a string")
Use line breaks
in a string

字符串的其他常用操作

获取字符串的长度 nchar()

> nchar("Social Network")
[1] 14

字符串的拼接 paste()sep 参数为连接的字符:

> paste("Social", "Network", sep = "-")
[1] "Social-Network"

字符串的分割 strsplit()

> strsplit("Social-Network", "-")
[[1]]
[1] "Social" "Network"

字符串的截取 substr(),要注意的是,和大多数语言不同,R 语言的索引从 1 开始

> substr("Social Network", 1, 6)
[1] "Social"

字符串的格式化输出 sprintf(),在 R 语言中也采用类似 C 语言的风格对变量进行格式化:

  1. %s:字符串
  2. %f:浮点型
  3. %d:整数
  4. %e:科学计数法
> sprintf("The degree of the node is %d\n", 4)
[1] "The degree of the node is 4\n"

当需要输出转义字符串时,可以在外层套用 cat()

> cat(sprintf("The degree of the node is %d\n", 4))
The degree of the node is 4

️ 练习

1. 第一章留下的问题 "a"+"b" 会输出 ab 吗,如何将"a""b" 拼接成 "ab"

2. 截取 "Social Network" 中的 "Network"

参考

  1. An Introduction to R
  2. R 字符串 | 菜鸟教程

社交网络分析的 R 基础:(二)变量与字符串的更多相关文章

  1. 社交网络分析的 R 基础:(一)初探 R 语言

    写在前面 3 年的硕士生涯一转眼就过去了,和社交网络也打了很长时间交道.最近突然想给自己挖个坑,想给这 3 年写个总结,画上一个句号.回想当时学习 R 语言时也是非常戏剧性的,开始科研生活时到处发邮件 ...

  2. 社交网络分析的 R 基础:(三)向量、矩阵与列表

    在第二章介绍了 R 语言中的基本数据类型,本章会将其组装起来,构成特殊的数据结构,即向量.矩阵与列表.这些数据结构在社交网络分析中极其重要,本质上对图的分析,就是对邻接矩阵的分析,而矩阵又是由若干个向 ...

  3. 社交网络分析的 R 基础:(四)循环与并行

    前三章中列出的大多数示例代码都很短,并没有涉及到复杂的操作.从本章开始将会把前面介绍的数据结构组合起来,构成真正的程序.大部分程序是由条件语句和循环语句控制,R 语言中的条件语句(if-else)和 ...

  4. 社交网络分析的 R 基础:(五)图的导入与简单分析

    如何将存储在磁盘上的邻接矩阵输入到 R 程序中,是进行社交网络分析的起点.在前面的章节中已经介绍了基本的数据结构以及代码结构,本章将会面对一个实质性问题,学习如何导入一个图以及计算图的一些属性. 图的 ...

  5. 社交网络分析的 R 基础:(六)绘图操作

    R 语言强大的可视化功能在科学研究中非常受欢迎,丰富的类库使得 R 语言可以绘制各种各样的图表.当然这些与本章内容毫无关系,因为笔者对绘制图表了解有限,仅限于能用的程度.接下来的内容无需额外安装任何包 ...

  6. Shell脚本之二 变量、字符串和数组

    一.Shell 变量 1.1 定义变量 定义变量时,变量名不加美元符号($),如: your_name="runoob.com" 注意,变量名和等号之间不能有空格,这可能和你熟悉的 ...

  7. Python基础二_操作字符串常用方法、字典、文件读取

    一.字符串常用方法: name.captitalize()                       #字符串首字母大写 name.center(50,'*')                   ...

  8. Java 基础:变量 与 字符串

    变量 Java中没有初始化的变量是不能直接使用的 局部变量 String msg; System.out.print(msg); 就会提示错误,我们必须显式的为变量指定一个初值如null.刚开始学Ja ...

  9. python基础(变量,字符串,列表,元组)

    #列表的操作list1 = ['wuqiang','lichang','changhao'] #列表的定义print(list1) #操作列表print(list1[-1]) #操作列表的最后一位li ...

随机推荐

  1. Unsupervised Domain Adaptation by Backpropagation

    目录 概 主要内容 代码 Ganin Y. and Lempitsky V. Unsupervised Domain Adaptation by Backpropagation. ICML 2015. ...

  2. [opencv]二维码识别率提升方案-resize调整

    这里采用循环resize的方式,对二维码图像进行放缩. 识别到name(二维码结果)不为空,则立即退出循环 //循环识别 for (int i = 1;name.empty(); i++){ resi ...

  3. 编写Java程序_输入一个5位数,判断它是不是回文数。即12321是回文数,个位与万位相同,十位与千位相同。

    要求: 输入一个5位数,判断它是不是回文数.即12321是回文数,个位与万位相同,十位与千位相同. 实现代码: package kaoshi; import java.util.Scanner; pu ...

  4. 【】URL中的文本IPv6地址的格式RFC2732

    RFC2732规范中URL中的文本IPv6地址的格式, 截取其中重要部分原文如下: RFC 2732 Format for Literal IPv6 Addresses in URL's Decemb ...

  5. 【洛谷】P1067 多项式输出

    原题链接:P1067 多项式输出 题目分析:学长推荐的OJ网站 --洛谷,发现挺好用的还可以下载提交出错的数据. 废话就不多说了,这道题属于基础题.提交出错主要是因为一些小细节不到位,这里就不一一赘述 ...

  6. 自旋锁-JUC系列

    公众号原文:自旋锁-JUC系列 前言 2022!这个年份现在看起来都觉得有那么些恍惚的未来感,然而现在已在脚下. 无边落木萧萧下, 不尽长江滚滚来! 人生如白驹过隙! 本来计划最近把AQS源码分析做了 ...

  7. ctf--web刷题记录 ACTF2020back up file 、极客大挑战2019php、secret file

    ACTF2020back up file backup file指的是备份文件,一般备份文件的后缀有".git" .".svn"." .swp&quo ...

  8. Solon Web 开发,十四、与Spring、Jsr330的常用注解对比

    Solon Web 开发 一.开始 二.开发知识准备 三.打包与运行 四.请求上下文 五.数据访问.事务与缓存应用 六.过滤器.处理.拦截器 七.视图模板与Mvc注解 八.校验.及定制与扩展 九.跨域 ...

  9. Docker 私服

    目录 什么是 Docker 私服? Docker 私服搭建 上传镜像至私服 从私服拉取镜像 什么是 Docker 私服? Docker 官方的 Docker Hub 是一个用于管理公共镜像的仓库,我们 ...

  10. manjaro20配置matebook fn驱动

    安装fn驱动 https://github.com/aymanbagabas/Huawei-WMI Latest release中下载并安装 matebook-applet_2.4.8_amd64.d ...