pandas
专 为 解 决 数 据 分 析 任 务 的 P y t h o n 库 \color{red}{专为解决数据分析任务的Python库} 专为解决数据分析任务的Python库提供高性能数据类型和分析工具,基于NumPy实现。
NumPy | 基础数据类型 | 关注数据的结构表达 | 维度:数据间关系 |
---|---|---|---|
Pandas | 扩展数据类型 | 关注数据的应用表达 | 数据与索引间关系 |
- 导入库
import pandas as pd
pandas库有两个数据类型:Series,DataFrame
Series
Series类型是由一组数据及与之相关的数据索引组成,有两个重要的属性
- .values属性:数据,np.array类型
- .index属性:索引,pd.indexes类型
Series创建
# 标量值创建(python列表)
s = pd.Series(25,index=['a','b','c'])
# 字典类型创建
y = pd.Series({
'a':25,'b':25,'c':25})
yy = pd.Series({
'a':9,'b':8,'c':7},index=['c','a','b','d'])
# ndarray创建
n = pd.Series(np.arange(5))
n1 = pd.Series(np.arange(5),index=np.arange(9,4,-1))
# 获取索引和数值
sindex = b.index # 获取索引
svalue = b.