计算Pandas中NaN值的数量是一个常见的数据分析任务,下面是详细的攻略:
- 使用
isnull
函数来选取DataFrame中的NaN值,并使用sum
函数计算结果中的True值的数量。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [4, np.nan, np.nan], 'C': [7, 8, 9]})
null_count = df.isnull().sum().sum()
print(f'There are {null_count} NaN values in the DataFrame')
输出:There are 3 NaN values in the DataFrame
- 也可以只计算某一列的NaN值的数量,可以使用
isnull
和sum
函数,结果将是一个Series,名字是对应的列名。
null_count = df['B'].isnull().sum()
print(f'Column B has {null_count} NaN values')
输出:Column B has 2 NaN values
- 如果要计算每一行或每一列NaN值的数量,可以使用
axis
=0或1来指定。
null_count_rows = df.isnull().sum(axis=1)
null_count_cols = df.isnull().sum(axis=0)
print(f'Null count per row:\n{null_count_rows}')
print(f'Null count per column:\n{null_count_cols}')
输出:
Null count per row:
0 0
1 2
2 0
dtype: int64
Null count per column:
A 1
B 2
C 0
dtype: int64
以上就是计算Pandas中NaN值数量的完整攻略,希望对你有帮助。