详解pandas.isnull()(检测缺失值)函数使用方法

  • Post category:Python

pandas.isnull()的作用与使用方法

作用

pandas.isnull()函数用于检测数据是否为缺失值(NaN)或缺失值(None)。其返回一个布尔类型的数据,表示哪些数据是缺失值。

使用方法

pandas.isnull()函数可以作用于pandas.Series和pandas.DataFrame等数据类型,其常用的使用方法和案例如下:

1. 作用于pandas.Series

# 导入pandas库
import pandas as pd

# 创建一个Series
s = pd.Series([1, 2, 3, None, 5, 6, None])

# 判断哪些数据是缺失值
is_null = pd.isnull(s)

print(is_null)

输出结果如下:

0    False
1    False
2    False
3     True
4    False
5    False
6     True
dtype: bool

可以看出,Serie s 中第4和第6个数据是缺失值(None),对应的 is_null 中的值为True,其他的数据是非缺失值,对应的是False。

2. 作用于pandas.DataFrame

# 导入pandas库
import pandas as pd

# 创建一个DataFrame
df = pd.DataFrame({ 'column1': [1, 2, None, 4], 'column2': [None, 6, 7, None] })

# 判断哪些数据是缺失值
is_null = pd.isnull(df)

print(is_null)

输出结果如下:

   column1  column2
0    False     True
1    False    False
2     True    False
3    False     True

可以看出,DataFrame df 中(1,2)、(3,1)位置上的数据是缺失值,对应值为True,其他数据是非缺失值,对应值为False。

实例解释

  • 实例1:对于一个销售记录数据表来说,检查数据表中是否存在缺失值数据。如表中的某一行记录信息完整度不足,可能存在缺失值,使用 pd.isnull() 可以判断是否存在缺失值。
  • 实例2:有一份学生的年龄和成绩数据,由于采集数据的误差,一些学生的数据有缺失,使用 pd.isnull() 可以找到有缺失的行并进行数据处理。