目录
isin函数是常用的求数据交集函数,然而它的反函数并不是isnotin,而是在前面加上~,下面会做具体讲解。
一、创建表1和表2
1. 表1
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
data1=DataFrame()
data1['a']=[4,1,3,4,3]
data1['b']=[3,1,8,6,7]
data1['c']=[3,1,1,2,2]
a | b | c | |
---|---|---|---|
0 | 4 | 3 | 3 |
1 | 1 | 1 | 1 |
2 | 3 | 8 | 1 |
3 | 4 | 6 | 2 |
4 | 3 | 7 | 2 |
2. 表2
data2=DataFrame()
data2['a']=[4,4,3]
data2['b']=[3,1,9]
data2['c']=[3,1,1]
a | b | c | |
---|---|---|---|
0 | 4 | 3 | 3 |
1 | 4 | 1 | 1 |
2 | 3 | 9 | 1 |
二、两张按照某列求交集和反交集
1. 表1和表2求交集
data1[data['a'].isin(data2['a'])]
a | b | c | |
---|---|---|---|
0 | 4 | 3 | 3 |
2 | 3 | 8 | 1 |
3 | 4 | 6 | 2 |
4 | 3 | 7 | 2 |
2. 表1和表2交集取反
data1[~data['a'].isin(data2['a'])]
a | b | c | |
---|---|---|---|
1 | 1 | 1 | 1 |