Pandas - 连接
-
简述
Pandas 提供了各种方便组合的工具Series, DataFrame, 和Panel对象。-
objs− 这是 Series、DataFrame 或 Panel 对象的序列或映射。
-
axis− {0, 1, ...},默认为 0。这是要连接的轴。
-
join- {'inner', 'outer'},默认为'outer'。如何处理其他轴上的索引。外部用于联合,内部用于交叉。
-
ignore_index- 布尔值,默认为 False。如果为 True,则不要使用连接轴上的索引值。结果轴将标记为 0, ..., n - 1。
-
join_axes- 这是索引对象的列表。用于其他 (n-1) 轴的特定索引,而不是执行内部/外部集逻辑。
-
-
连接对象
这concat函数完成了沿轴执行连接操作的所有繁重工作。让我们创建不同的对象并进行连接。它的输出如下 -假设我们想要将特定的键与切碎的 DataFrame 的每个片段相关联。我们可以通过使用keys论点 -它的输出如下 -结果的索引被复制;每个索引都重复。如果结果对象必须遵循自己的索引,则设置ignore_index到True.它的输出如下 -观察,索引完全改变并且键也被覆盖。如果需要同时添加两个对象axis=1,然后将追加新列。它的输出如下 -使用追加连接
一个有用的 concat 快捷方式是 Series 和 DataFrame 上的 append 实例方法。这些方法实际上早于 concat。他们串联在一起axis=0,即指数 -它的输出如下 -这append函数也可以采用多个对象 -它的输出如下 - -
时间序列
Pandas 提供了一个强大的工具来处理时间序列数据,尤其是在金融领域。在处理时间序列数据时,我们经常遇到以下情况 -- 生成时间序列
- 将时间序列转换为不同的频率
Pandas 提供了一套相对紧凑且独立的工具来执行上述任务。获取当前时间
datetime.now()为您提供当前日期和时间。它的输出如下 -创建时间戳
时间戳数据是将值与时间点相关联的最基本类型的时间序列数据。对于 pandas 对象,这意味着使用时间点。让我们举个例子 -它的输出如下 -也可以转换整数或浮点纪元时间。这些的默认单位是纳秒(因为这些是时间戳的存储方式)。但是,通常时期存储在另一个可以指定的单元中。让我们再举一个例子它的输出如下 -创建时间范围
它的输出如下 -改变时间的频率
它的输出如下 -转换为时间戳
要转换类日期对象的系列或列表类对象,例如字符串、纪元或混合,您可以使用to_datetime功能。传递时,这将返回一个系列(具有相同的索引),而一个list-like被转换为DatetimeIndex. 看看下面的例子 -它的输出如下 -NaT方法Not a Time(相当于 NaN)让我们再举一个例子。它的输出如下 -