单纯携带明细记录
如果你想在 Pandas 中对分组后的明细记录创建一个列表,并将其放入 DataFrame 中,你可以使用 groupby
和 apply
方法来实现。下面是一个示例,演示了如何将分组后的明细记录作为列表放入 DataFrame 中:
import pandas as pd
import pymysql
# 建立到 MySQL 数据库的连接
connection = pymysql.connect(
host='your_host',
user='your_username',
password='your_password',
database='your_database'
)
# 假设你已经建立了数据库连接 connection,并且有一个 SQL 查询 query
query = "SELECT * FROM your_table"
# 从数据库中读取数据并将结果存储在 DataFrame 中
df = pd.read_sql(query, connection)
# 使用 groupby 和 apply 方法对分组后的明细记录创建一个列表,并将其放入 DataFrame 中
grouped = df.groupby('column_to_group_by').apply(lambda x: x.to_dict(orient='records')).reset_index(name='detail_records')
# 打印包含明细记录列表的分组结果
print(grouped)
# 关闭数据库连接
connection.close()
在这个示例中,我们使用 groupby
方法按照 ‘column_to_group_by’ 列进行分组,并使用 apply
方法应用了一个 lambda 函数,该函数将每个分组的明细记录转换为字典列表,并将其放入一个新的 DataFrame 列中。最后,我们使用 reset_index
方法重置索引并为新的列命名。这样就可以得到包含明细记录列表的分组结果了。
聚合同时携带明细记录
当你想要同时进行聚合操作并在结果中携带明细记录时,可以使用自定义的聚合函数来实现这一目标。下面是一个示例,演示了如何在 Pandas 中同时进行聚合操作并携带明细记录:
import pandas as pd
import pymysql
# 建立到 MySQL 数据库的连接
connection = pymysql.connect(
host='your_host',
user='your_username',
password='your_password',
database='your_database'
)
# 假设你已经建立了数据库连接 connection,并且有一个 SQL 查询 query
query = "SELECT * FROM your_table"
# 从数据库中读取数据并将结果存储在 DataFrame 中
df = pd.read_sql(query, connection)
# 定义一个自定义的聚合函数,用于同时进行聚合操作并携带明细记录
def agg_with_details(x):
result = {
'mean_value': x['numeric_column'].mean(),
'detail_records': x.to_dict(orient='records')
}
return pd.Series(result)
# 使用 groupby 和 apply 方法对分组后的数据进行聚合并携带明细记录
grouped_with_details = df.groupby('column_to_group_by').apply(agg_with_details)
# 打印包含聚合结果和明细记录的分组结果
print(grouped_with_details)
# 关闭数据库连接
connection.close()
在这个示例中,我们首先定义了一个名为 agg_with_details
的自定义聚合函数,该函数同时计算了 ‘numeric_column’ 列的均值,并将明细记录作为字典列表放入结果中。然后,我们使用 groupby
和 apply
方法对分组后的数据应用了这个自定义聚合函数,得到了同时包含聚合结果和明细记录的分组结果。