Bootstrap

dataframe 筛选_创建pd.DataFrame的方法. pd.DataFrame函数详解

DataFrame是由多种类型的列构成的二维标签数据结构.[1]

往往包含index(行标签)columns(列标签), 彼此独立, 互不影响

直观理解:DataFrame 是带标签的二维数组

1.由(元组),[列表]或一维数组 构成的(元组)或[列表]创建

(元组)和[列表]在这里用法几乎相同, 下面用[列表]代表

1.1[[列表]列表]或[(元组)列表]或([列表]元组)或((元组)元组)

import 

972d53e9a519a284aa0898836bb1dd6c.png
标签未指定, 则默认[0, N-1]之间的整数, N为索引总数

1.2[一维数组列表]或(一维数组元组)

import 

972d53e9a519a284aa0898836bb1dd6c.png

2.由二维数组创建

import 

972d53e9a519a284aa0898836bb1dd6c.png

3.由(元组),[列表]或一维数组 构成的字典创建

3.1{(元组)字典} 或 {[列表]字典}

import 

1c8d3f0a3e34227a493275e6e12655d7.png
标签未指定, 则默认[0, N-1]之间的整数, N为索引总数

3.2{一维数组字典}

import 

1c8d3f0a3e34227a493275e6e12655d7.png

4.由{字典} 构成的[列表]创建

import 

72423c3ef0119e67813ff7bef7aa9444.png

5.由{字典} 构成的{字典}创建

import 

4a3a4b40e9695d55ef6217d3e4b732fd.png

6.由Series创建

Series的name变成了DataFrame的index.

Series的index变成了DataFrame的column.

import 

dac94c5a88bf8cfe2ff38446d559495e.png

7.由标量创建

import 

f37933172062fed04c2d71e30139df1d.png
几行几列都可以. 标量创建必须指定标签, 否则报错

必须用indexcolumns关键字指定行列标签.

详解

本文函数为 pd.DataFrame(data=None, index=None, columns=None)

data, 位置参数, 按顺序传入时, 不用写data=传入数据

import 

生成DataFrame时, 长度尽量保持一致, 省的出错

import 

3e345abe3d3f88d4d5375b63c1db95e6.png
长度不相同, 引入NaN值
import 

657ef59a6300780b54366f8165c86e46.png
退化为单列

以[列表]作为键值构成的字典, 键值长度必须一致

import 

243ff467c9c17f3741916e7a84cc479b.png
部分报错信息, 数组一定得一样长

index, 指定行标签, columns, 指定列标签

没有标签, 指定时, [标签列表]中元素个数要与其行或列数对应相同.

import 

f88ec029511edce12c5af19572e98aa6.png
部分报错信息, 传递值的形状是3x3的, 然鹅索引形状是4x3的

已有标签, 再指定, 则进行索引筛选, 没有的引入NaN值, 举个栗子

import 

1f9ff071a87975606849332b6390e473.png

还有如下可选关键字

dtype, 给DataFrame里的成员指定数据类型, 默认dtype=None

import 

e36a317aed69abc94103750f807194af.png

参考

  1. ^https://www.pypandas.cn/docs/getting_started/dsintro.html#dataframe

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;