Pandas - 与 SQL 的比较
-
简述
由于许多潜在的 Pandas 用户对 SQL 有一定的了解,因此本页旨在提供一些示例,说明如何使用 pandas 执行各种 SQL 操作。它的输出如下 - -
select
在 SQL 中,选择是使用您选择的以逗号分隔的列列表完成的(或 * 选择所有列) -使用 Pandas,通过将列名列表传递给 DataFrame 来完成列选择 -让我们检查完整的程序 -它的输出如下 -在没有列名列表的情况下调用 DataFrame 将显示所有列(类似于 SQL 的 *)。 -
where
SQL 中的过滤是通过 WHERE 子句完成的。DataFrames 可以通过多种方式过滤;其中最直观的是使用布尔索引。让我们检查完整的程序 -它的输出如下 -上面的语句将一系列 True/False 对象传递给 DataFrame,返回所有为 True 的行。 -
group by
此操作获取整个数据集中每个组中的记录计数。例如,一个查询为我们获取性别留下的提示数量 -熊猫等价物是 -让我们检查完整的程序 -它的输出如下 - -
top n
SQL 返回top n rows使用LIMIT−熊猫等价物是 -让我们检查一下完整的例子 -它的输出如下 -这些是我们比较的几个基本操作,我们在 Pandas 库的前几章中学到了这些操作。