简述
背后的一般概念R是作为以编译语言(如 C、C++ 和 Fortran)开发的其他软件的接口,并为用户提供分析数据的交互式工具。
导航到图书 zip 文件的文件夹bda/part2/R_introduction并打开R_introduction.Rproj文件。这将打开一个 RStudio 会话。然后打开 01_vectors.R 文件。逐行运行脚本并按照代码中的注释进行操作。为了学习,另一个有用的选择是只输入代码,这将帮助你习惯 R 语法。在 R 中,注释用# 符号书写。
为了在书中展示运行 R 代码的结果,在对代码求值后,对 R 返回的结果进行注释。这样,您可以复制粘贴书中的代码,并在 R 中直接尝试其中的部分内容。
我们来分析一下前面代码中发生了什么。我们可以看到可以用数字和字母创建向量。我们不需要事先告诉 R 我们想要什么类型的数据类型。最后,我们能够创建一个包含数字和字母的向量。向量 mixed_vec 已将数字强制转换为字符,我们可以通过可视化值如何在引号内打印来看到这一点。
以下代码显示了函数类返回的不同向量的数据类型。通常使用类函数来“询问”一个对象,询问他的类是什么。
R 也支持二维对象。在以下代码中,有 R 中使用的两种最流行的数据结构的示例:matrix 和 data.frame。
如上例所示,可以在同一个对象中使用不同的数据类型。一般来说,这就是数据在数据库中的呈现方式,API 部分数据是文本或字符向量和其他数字。分析师的工作是确定要分配哪种统计数据类型,然后为其使用正确的 R 数据类型。在统计中,我们通常认为变量有以下类型 -
在 R 中,向量可以属于以下类别 -
R 为每种统计类型的变量提供了一种数据类型。然而,有序因子很少使用,但可以由函数因子创建,或有序。
以下部分介绍索引的概念。这是一个非常常见的操作,它处理选择对象的部分并对它们进行转换的问题。