Bootstrap

python DataFrame数据合并 merge()、concat()方法

在这里插入图片描述

相比方法①,区别在于,如图,方法②合并出的数据中有重复列。


重要参数

pd.merge(right,how=‘inner’, on=“None”, left_on=“None”, right_on=“None”, left_index=False, right_index=False )

| 参数 | 描述 |

| — | — |

| left | 左表,合并对象,DataFrame或Series |

| right | 右表,合并对象,DataFrame或Series |

| how | 合并方式,可以是left(左合并), right(右合并), outer(外合并), inner(内合并) |

| on | 基准列 的列名 |

| left_on | 左表基准列列名 |

| right_on | 右表基准列列名 |

| left_index | 左列是否以index为基准,默认False,否 |

| right_index | 右列是否以index为基准,默认False,否 |

其中,left_index与right_index 不能与 on 同时指定。

合并方式 left right outer inner

准备数据‘

新准备一组数据:

import pandas as pd

df1 = pd.DataFrame({‘id’: [‘001’, ‘002’, ‘003’],

‘num1’: [120, 101, 104],

‘num2’: [110, 102, 121],

‘num3’: [105, 120, 113]})

df2 = pd.DataFrame({‘id’: [‘001’, ‘004’, ‘003’],

‘num4’: [80, 86, 79]})

print(df1)

print(“=======================================”)

print(df2)

print(“=======================================”)

在这里插入图片描述


inner(默认)

使用来自两个数据集的键的交集

df_merge = pd.merge(df1, df2, on=‘id’)

print(df_merge

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;