简述
SQL 代表结构化查询语言。它是传统数据仓库和大数据技术中用于从数据库中提取数据的最广泛使用的语言之一。为了演示 SQL 的基础知识,我们将使用示例。为了专注于语言本身,我们将在 R 中使用 SQL。就编写 SQL 代码而言,这与在数据库中所做的完全一样。
SQL 的核心是三个语句:SELECT、FROM 和 WHERE。以下示例利用了最常见的 SQL 用例。导航到文件夹bda/part2/SQL_introduction并打开SQL_introduction.Rproj文件。然后打开 01_select.R 脚本。为了在 R 中编写 SQL 代码,我们需要安装sqldf包,如以下代码所示。
select 语句用于从表中检索列并对其进行计算。最简单的 SELECT 语句在ej1. 我们还可以创建新变量,如图所示ej2.
SQL 最常用的功能之一是 group by 语句。这允许计算另一个变量的不同组的数值。打开脚本 02_group_by.R。
SQL 最有用的特性是连接。连接意味着我们要使用一列将表 A 和表 B 合并到一个表中,以匹配两个表的值。实际上,有不同类型的连接,开始使用这些将是最有用的:内连接和左外连接。