Pandas - 索引和选择数据
-
简述
在本章中,我们将讨论如何对日期进行切片和切块,以及如何获取 pandas 对象的子集。Python 和 NumPy 索引运算符“[]”和属性运算符“.” 在广泛的用例中提供对 Pandas 数据结构的快速轻松访问。但是,由于事先不知道要访问的数据的类型,因此直接使用标准运算符有一些优化限制。对于生产代码,我们建议您利用本章中介绍的优化的 pandas 数据访问方法。Pandas 现在支持三种类型的多轴索引;下表中提到了这三种类型 -序号 索引和描述 1 .loc()基于标签2 .iloc()基于整数3 .ix()基于标签和整数 -
.loc()
熊猫提供了各种方法来纯粹label based indexing. 切片时,还包括起始边界。整数是有效的标签,但它们指的是标签而不是位置。.loc()有多种访问方法,如 -- 单个标量标签
- 标签列表
- 切片对象
- 布尔数组
loc采用两个由“,”分隔的单/列表/范围运算符。第一个表示行,第二个表示列。示例 1
它的输出如下 -示例 2
它的输出如下 -示例 3
它的输出如下 -示例 4
它的输出如下 -示例 5
它的输出如下 - -
.loc ()
Pandas 提供了各种方法来获得基于整数的索引。像 python 和 numpy 一样,这些是0-based索引。各种访问方法如下 -- 一个整数
- 整数列表
- 范围值
示例 1
它的输出如下 -示例 2
它的输出如下 -示例 3
它的输出如下 - -
.ix ()
除了基于纯标签和基于整数之外,Pandas 还提供了一种使用 .ix() 运算符选择和子集对象的混合方法。示例 1
它的输出如下 -示例 2
它的输出如下 - -
符号的使用
使用多轴索引从 Pandas 对象中获取值使用以下符号 -目的 索引器 返回类型 Series s.loc[indexer] 标量值 DataFrame df.loc[row_index,col_index] 系列对象 Panel p.loc[item_index,major_index,minor_index] p.loc[item_index,major_index,minor_index] 注意 − .iloc() & .ix()应用相同的索引选项和返回值。现在让我们看看如何在 DataFrame 对象上执行每个操作。我们将使用基本的索引运算符 '[ ]' -示例 1
它的输出如下 -注意− 我们可以将值列表传递给 [ ] 以选择这些列。示例 2
它的输出如下 -示例 3
它的输出如下 -属性访问
可以使用属性运算符“.”来选择列。例子
它的输出如下 -