Bootstrap

Python 分组后携带明细记录

单纯携带明细记录

如果你想在 Pandas 中对分组后的明细记录创建一个列表,并将其放入 DataFrame 中,你可以使用 groupbyapply 方法来实现。下面是一个示例,演示了如何将分组后的明细记录作为列表放入 DataFrame 中:

import pandas as pd
import pymysql

# 建立到 MySQL 数据库的连接
connection = pymysql.connect(
    host='your_host',
    user='your_username',
    password='your_password',
    database='your_database'
)

# 假设你已经建立了数据库连接 connection,并且有一个 SQL 查询 query
query = "SELECT * FROM your_table"

# 从数据库中读取数据并将结果存储在 DataFrame 中
df = pd.read_sql(query, connection)

# 使用 groupby 和 apply 方法对分组后的明细记录创建一个列表,并将其放入 DataFrame 中
grouped = df.groupby('column_to_group_by').apply(lambda x: x.to_dict(orient='records')).reset_index(name='detail_records')

# 打印包含明细记录列表的分组结果
print(grouped)

# 关闭数据库连接
connection.close()

在这个示例中,我们使用 groupby 方法按照 ‘column_to_group_by’ 列进行分组,并使用 apply 方法应用了一个 lambda 函数,该函数将每个分组的明细记录转换为字典列表,并将其放入一个新的 DataFrame 列中。最后,我们使用 reset_index 方法重置索引并为新的列命名。这样就可以得到包含明细记录列表的分组结果了。

聚合同时携带明细记录

当你想要同时进行聚合操作并在结果中携带明细记录时,可以使用自定义的聚合函数来实现这一目标。下面是一个示例,演示了如何在 Pandas 中同时进行聚合操作并携带明细记录:

import pandas as pd
import pymysql

# 建立到 MySQL 数据库的连接
connection = pymysql.connect(
    host='your_host',
    user='your_username',
    password='your_password',
    database='your_database'
)

# 假设你已经建立了数据库连接 connection,并且有一个 SQL 查询 query
query = "SELECT * FROM your_table"

# 从数据库中读取数据并将结果存储在 DataFrame 中
df = pd.read_sql(query, connection)

# 定义一个自定义的聚合函数,用于同时进行聚合操作并携带明细记录
def agg_with_details(x):
    result = {
        'mean_value': x['numeric_column'].mean(),
        'detail_records': x.to_dict(orient='records')
    }
    return pd.Series(result)

# 使用 groupby 和 apply 方法对分组后的数据进行聚合并携带明细记录
grouped_with_details = df.groupby('column_to_group_by').apply(agg_with_details)

# 打印包含聚合结果和明细记录的分组结果
print(grouped_with_details)

# 关闭数据库连接
connection.close()

在这个示例中,我们首先定义了一个名为 agg_with_details 的自定义聚合函数,该函数同时计算了 ‘numeric_column’ 列的均值,并将明细记录作为字典列表放入结果中。然后,我们使用 groupbyapply 方法对分组后的数据应用了这个自定义聚合函数,得到了同时包含聚合结果和明细记录的分组结果。

;