Pandas 教程
-
简述
Pandas 是一个开源的、BSD 许可的 Python 库,为 Python 编程语言提供高性能、易于使用的数据结构和数据分析工具。Python with Pandas 用于广泛的领域,包括金融、经济、统计、分析等学术和商业领域。在本教程中,我们将学习 Python Pandas 的各种特性以及如何在实践中使用它们。本教程是为那些寻求学习 Pandas 基础知识和各种功能的人准备的。它对从事数据清理和分析工作的人特别有用。完成本教程后,您会发现自己处于中等专业水平,从那里您可以将自己提升到更高水平的专业知识。您应该对计算机编程术语有基本的了解。对任何编程语言有基本的了解是加分项。Pandas 库使用 NumPy 的大部分功能。建议您在继续本教程之前阅读我们关于 NumPy 的教程。您可以从 - NumPy 教程中访问它 -
Pandas 的主要特点
- 具有默认和自定义索引的快速高效的 DataFrame 对象。
- 用于将数据从不同文件格式加载到内存数据对象中的工具。
- 数据对齐和缺失数据的综合处理。
- 日期集的重塑和旋转。
- 大型数据集的基于标签的切片、索引和子集化。
- 可以删除或插入数据结构中的列。
- 按数据分组以进行聚合和转换。
- 高性能的数据合并和连接。
- 时间序列功能。
-
Pandas 有用的资源