[python][代码]Python中操作DataFrame的常用方法

Python 中操作 DataFrame 的常用方法主要依赖于 pandas 库，这是一个功能强大的数据分析工具。以下是一些基本和常用的 DataFrame 操作方法：

1. 创建 DataFrame:

python
import pandas as pd
data = {'Column1': [1, 2, 3], 'Column2': ['a', 'b', 'c']}
df = pd.DataFrame(data)

2.查看 DataFrame:

df.head(n): 查看前 n 行，默认为 5 行。

df.tail(n): 查看后 n 行，默认为 5 行。

3.选择数据:

通过列名选择列：df['Column1']

通过列索引选择列：df.iloc[:, 0]

通过条件选择行：df[df['Column1'] > 1]

4.数据过滤:

使用布尔索引：df[df['Column1'] == 2]

5.添加列:

df['NewColumn'] = [4, 5, 6]

6.修改列名:

单个列名：df.rename(columns={'OldName': 'NewName'})

多个列名：df.columns = ['NewName1', 'NewName2', ...]

7.删除列:

df.drop('Column1', axis=1, inplace=True)

8.排序:

df.sort_values(by='Column1')

df.sort_index()

9.聚合和统计:

df.mean(): 计算均值

df.sum(): 求和

df.max(): 求最大值

df.min(): 求最小值

10.分组:

grouped = df.groupby('Column1')

11.合并 DataFrame:

纵向合并：pd.concat([df1, df2])

横向合并：df1.merge(df2, on='key_column')

12.数据类型转换:

df['Column1'] = df['Column1'].astype(int)

13.缺失数据处理:

删除缺失值：df.dropna()

填充缺失值：df.fillna(value)

14.数据重塑:

透视表：pd.pivot_table(df, values='Column1', index='Column2', columns='Column3', aggfunc='mean')

堆叠/解堆叠：df.stack() / df.unstack()

15.保存和读取数据:

保存到 CSV：df.to_csv('filename.csv', index=False)

读取 CSV：pd.read_csv('filename.csv')

这些只是 pandas 中 DataFrame 操作的一部分常用方法。根据你的具体需求，pandas 库提供了更多的功能和方法。