详解pandas.DataFrame.sum()(计算数据框元素总和)函数使用方法

  • Post category:Python

pandas.DataFrame.sum()方法是pandas Dataframe类中的一个函数,用于计算DataFrame中特定轴上各列或各行数值的总和。它可以根据具体的需求对数据集进行处理和分析,提高数据处理和统计效率。

语法

DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

参数解析

  • axis:表示计算总和的轴向,0代表行方向,1代表列方向。
  • skipna:表示是否排除NaN空值,设为True表示排除,False表示保留。
  • level:MultiIndex层次结构中的哪一层计算。
  • numeric_only:表示是否只对数值类型的列进行计算,设为True表示只计算数值类型,设为False表示计算所有列。

示例1

下面是对一个DataFrame进行列求和的实例:

import pandas as pd
import numpy as np

df = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]})
print(df)

# 所有列的和
print(df.sum())

# 按行(即对每列)求和,可用axis=0或axis='index'表示
print(df.sum(axis=0))

# 输出结果
#    A  B  C
# 0  1  4  7
# 1  2  5  8
# 2  3  6  9
# A     6
# B    15
# C    24
# dtype: int64
# A     6
# B    15
# C    24
# dtype: int64

在例子中,首先创建了一个包含三列的DataFrame。然后,通过调用df.sum()函数来计算所有列的总和,包括所有的NaN值。如果只想计算某个轴(例如列)的总和,可以通过提供一个axis=0为参数来实现。这里的结果与所有列的总和相同。

示例2

下面是对一个DataFrame进行行求和的实例:

import pandas as pd

data = {"name":["张三","李四","王五"],"age":[22,23,25],"height":[173,178,180]}

df = pd.DataFrame(data)
print(df)

# 所有行的和
print(df.sum(axis=1))

# 输出结果
#   name  age  height
# 0  张三   22     173
# 1  李四   23     178
# 2  王五   25     180
# 0    195
# 1    204
# 2    205
# dtype: int64

在例子中,首先创建了一个包含三行的DataFrame。然后,通过调用df.sum(axis=1)方法对每行进行求和,得到了每行的总和。

参考