一、前言
相信大多数朋友们在使用Pandas读取Excel数据(如csv文件)时,表格中往往含有异常的值。这些异常值通过包括三大类: None,null,NaN。但是None和null通常可以通过“==”来判断,相对比较简单,因此本文主要介绍对NaN异常值的处理。众所周知,NaN其实指的是 Not A Number,也就是说不是一个数。
二、判断是否含有 NaN
在Pandas DataFrame中判断是否含有NaN值的方法是pd.isna(),下面就以实际例子给大家展示下:
1.首先这是使用Pandas读出来的原始数据,从下图中可以看到其中包含很多NaN值。
2.使用isna() 方法会返回一个仅含True和False这两种值的DataFrame,该方法主要用来判断表格中的每一个元素是否为NaN,使用方法很简单,就是your_dataframe.isna(),最后得到的结果如下图所示。可以看到,之前为NaN值的那些位置,都已经成功判断出来了。
3.使用isna