python DataFrame数据合并 merge()、concat()方法

在这里插入图片描述

相比方法①，区别在于，如图，方法②合并出的数据中有重复列。

pd.merge(right,how=‘inner’, on=“None”, left_on=“None”, right_on=“None”, left_index=False, right_index=False )

| 参数 | 描述 |

| — | — |

| left | 左表，合并对象，DataFrame或Series |

| right | 右表，合并对象，DataFrame或Series |

| how | 合并方式，可以是left(左合并), right(右合并), outer(外合并), inner(内合并) |

| on | 基准列的列名 |

| left_on | 左表基准列列名 |

| right_on | 右表基准列列名 |

| left_index | 左列是否以index为基准，默认False，否 |

| right_index | 右列是否以index为基准，默认False，否 |

其中，left_index与right_index 不能与 on 同时指定。

新准备一组数据:

import pandas as pd

df1 = pd.DataFrame({‘id’: [‘001’, ‘002’, ‘003’],

‘num1’: [120, 101, 104],

‘num2’: [110, 102, 121],

‘num3’: [105, 120, 113]})

df2 = pd.DataFrame({‘id’: [‘001’, ‘004’, ‘003’],

‘num4’: [80, 86, 79]})

print(df1)

print(“=======================================”)

print(df2)

print(“=======================================”)

在这里插入图片描述

使用来自两个数据集的键的交集

df_merge = pd.merge(df1, df2, on=‘id’)

print(df_merge