pandas.notnull()是pandas库中的一个函数,用于判断一个值是否为缺失值NaN(not a number)或None。
具体的作用如下:
- 判断数据是否为缺失值NaN或None
- 返回相应的布尔值,如果是,返回False,否则返回True。
该函数的使用方法如下:
pandas.notnull(obj)
其中,obj表示要判断的数据,可以是一个单独的数值、列表、字典或者DataFrame结构体。
下面介绍两个使用实例:
【示例1】判断数据中是否存在NaN或None值:
# 导入pandas库
import pandas as pd
# 创建一个包含NaN值的Series结构体
s = pd.Series(data=[1, 2, NaN, None, 3, 4])
# 使用notnull()函数进行判断
mask = pd.notnull(s)
# 输出判断结果
print(mask)
运行结果:
0 True
1 True
2 False
3 False
4 True
5 True
dtype: bool
以上代码中,我们创建了一个包含NaN和None值的Series结构体,然后使用notnull()函数对其进行判断。最终结果返回了一个bool数组,其中每个元素是否为NaN或None值的判断结果。
【示例2】使用notnull()函数进行数据筛选:
# 导入pandas库
import pandas as pd
# 创建一个包含NaN值的DataFrame结构体
df = pd.DataFrame(data=[[1, 2, NaN], [2, None, 4], [NaN, 3, NaN]], columns=['A', 'B', 'C'])
# 使用notnull()函数进行数据筛选
df_filtered = df[pd.notnull(df['B'])]
# 输出筛选结果
print(df_filtered)
运行结果:
A B C
0 1 2.0 NaN
2 NaN 3.0 NaN
以上代码中,我们创建了一个包含NaN值的DataFrame结构体,然后使用notnull()函数进行了数据筛选,筛选出B列中不含NaN值的数据行。筛选结果即为DataFrame的部分数据。