pandas.isnull()的作用与使用方法
作用
pandas.isnull()函数用于检测数据是否为缺失值(NaN)或缺失值(None)。其返回一个布尔类型的数据,表示哪些数据是缺失值。
使用方法
pandas.isnull()函数可以作用于pandas.Series和pandas.DataFrame等数据类型,其常用的使用方法和案例如下:
1. 作用于pandas.Series
# 导入pandas库
import pandas as pd
# 创建一个Series
s = pd.Series([1, 2, 3, None, 5, 6, None])
# 判断哪些数据是缺失值
is_null = pd.isnull(s)
print(is_null)
输出结果如下:
0 False
1 False
2 False
3 True
4 False
5 False
6 True
dtype: bool
可以看出,Serie s 中第4和第6个数据是缺失值(None),对应的 is_null 中的值为True,其他的数据是非缺失值,对应的是False。
2. 作用于pandas.DataFrame
# 导入pandas库
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({ 'column1': [1, 2, None, 4], 'column2': [None, 6, 7, None] })
# 判断哪些数据是缺失值
is_null = pd.isnull(df)
print(is_null)
输出结果如下:
column1 column2
0 False True
1 False False
2 True False
3 False True
可以看出,DataFrame df 中(1,2)、(3,1)位置上的数据是缺失值,对应值为True,其他数据是非缺失值,对应值为False。
实例解释
- 实例1:对于一个销售记录数据表来说,检查数据表中是否存在缺失值数据。如表中的某一行记录信息完整度不足,可能存在缺失值,使用
pd.isnull()
可以判断是否存在缺失值。 - 实例2:有一份学生的年龄和成绩数据,由于采集数据的误差,一些学生的数据有缺失,使用
pd.isnull()
可以找到有缺失的行并进行数据处理。