Bootstrap

python : isin()使用方法

在python中,isin() 方法主要与Pandas库中的Series和DataFrame对象关联,用于检查数据系列中的元素是否包含在另一个数组或列表中。这个方法非常有用,特别是在进行数据筛选、数据分析或是处理缺失值等场景。

isin()方法基本语法如下:

DataFrame.isin(values)
Series.isin(values)

 

  • DataFrame 或 Series:你想要检查其元素是否存在于另一个集合中的Pandas对象。
  • values:一个列表、集合、数组或Series,包含了你想要检查的数据系列中的元素是否属于的值。

isin()方法会返回一个布尔类型的Series或DataFrame,对应原始数据中的每个元素,如果该元素存在于values中,则返回True,否则返回False。

示例如下:

1.Series例子

import pandas as pd

# 创建一个Series
s = pd.Series(['apple', 'banana', 'cherry', 'apple'])

# 使用isin()检查元素是否为'apple'或'orange'
result = s.isin(['apple', 'orange'])
print(result)

 

2.DataFrame例子

import pandas as pd

# 创建一个DataFrame
df = pd.DataFrame({'fruit': ['apple', 'banana', 'cherry'],
                   'color': ['red', 'yellow', 'red']})

# 检查fruit列是否包含'apple'或'orange',color列是否包含'red'
result = df.isin({'fruit': ['apple', 'orange'], 'color': ['red']})
print(result)

 

 

应用

  • 数据过滤:结合布尔索引,可以直接基于isin()的结果来过滤数据。

        例如,df[df['fruit'].isin(['apple'])]将只保留fruit列为'apple'的行。

  • 缺失值处理:检查某列是否包含特定的缺失值标记(如NaN)。
  • 数据分组或标记:基于isin()的结果,可以给数据添加新的分类标签或进行分组操作。

总之,isin()是Pandas中一个强大且灵活的方法,用于基于指定值集对数据进行条件筛选和分析。

;