Bootstrap

python数据分析————pandas库的数据结构Series和DataFrame的基本使用

pandas

专 为 解 决 数 据 分 析 任 务 的 P y t h o n 库 \color{red}{专为解决数据分析任务的Python库} Python提供高性能数据类型和分析工具,基于NumPy实现。

NumPy 基础数据类型 关注数据的结构表达 维度:数据间关系
Pandas 扩展数据类型 关注数据的应用表达 数据与索引间关系
  • 导入库
import pandas as pd

pandas库有两个数据类型:Series,DataFrame

Series

Series类型是由一组数据及与之相关的数据索引组成,有两个重要的属性

  • .values属性:数据,np.array类型
  • .index属性:索引,pd.indexes类型
Series创建
# 标量值创建(python列表)
s = pd.Series(25,index=['a','b','c'])				
# 字典类型创建
y = pd.Series({
   'a':25,'b':25,'c':25})				
yy = pd.Series({
   'a':9,'b':8,'c':7},index=['c','a','b','d'])
# ndarray创建
n = pd.Series(np.arange(5))
n1 = pd.Series(np.arange(5),index=np.arange(9,4,-1))
# 获取索引和数值
sindex = b.index     # 获取索引
svalue = b.
;