Pandas 介绍
1 Pandas 介绍
 (1) (1) (1) (1) (1) (1).c9ef04c2.png)
- 2008 年 WesMcKinney 开发出的库
- 专门用于数据挖掘的开源 python 库
- 以 Numpy 为基础,借力 Numpy 模块在计算方面性能高的优势
- 基于 matplotlib,能够简便的画图
- 独特的数据结构
2 为什么使用 Pandas
Numpy 已经能够帮助我们处理数据,能够结合 matplotlib 解决部分数据展示等问题,那么 pandas 学习的目的在什么地方呢?
增强图表可读性
回忆我们在 numpy 当中创建学生成绩表样式:
返回结果:
pythonarray([[92, 55, 78, 50, 50], [71, 76, 50, 48, 96], [45, 84, 78, 51, 68], [81, 91, 56, 54, 76], [86, 66, 77, 67, 95], [46, 86, 56, 61, 99], [46, 95, 44, 46, 56], [80, 50, 45, 65, 57], [41, 93, 90, 41, 97], [65, 83, 57, 57, 40]])array([[92, 55, 78, 50, 50], [71, 76, 50, 48, 96], [45, 84, 78, 51, 68], [81, 91, 56, 54, 76], [86, 66, 77, 67, 95], [46, 86, 56, 61, 99], [46, 95, 44, 46, 56], [80, 50, 45, 65, 57], [41, 93, 90, 41, 97], [65, 83, 57, 57, 40]])如果数据展示为这样,可读性就会更友好:
.7d3f68d7.png)
便捷的数据处理能力
 (1) (1) (1) (1) (1) (1).91e8b96b.png)
- 读取文件方便
- 封装了 Matplotlib、Numpy 的画图和计算