pandas.DataFrame.sum()
方法是pandas Dataframe类中的一个函数,用于计算DataFrame中特定轴上各列或各行数值的总和。它可以根据具体的需求对数据集进行处理和分析,提高数据处理和统计效率。
语法
DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
参数解析
- axis:表示计算总和的轴向,0代表行方向,1代表列方向。
- skipna:表示是否排除NaN空值,设为True表示排除,False表示保留。
- level:MultiIndex层次结构中的哪一层计算。
- numeric_only:表示是否只对数值类型的列进行计算,设为True表示只计算数值类型,设为False表示计算所有列。
示例1
下面是对一个DataFrame进行列求和的实例:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]})
print(df)
# 所有列的和
print(df.sum())
# 按行(即对每列)求和,可用axis=0或axis='index'表示
print(df.sum(axis=0))
# 输出结果
# A B C
# 0 1 4 7
# 1 2 5 8
# 2 3 6 9
# A 6
# B 15
# C 24
# dtype: int64
# A 6
# B 15
# C 24
# dtype: int64
在例子中,首先创建了一个包含三列的DataFrame。然后,通过调用df.sum()
函数来计算所有列的总和,包括所有的NaN值。如果只想计算某个轴(例如列)的总和,可以通过提供一个axis=0
为参数来实现。这里的结果与所有列的总和相同。
示例2
下面是对一个DataFrame进行行求和的实例:
import pandas as pd
data = {"name":["张三","李四","王五"],"age":[22,23,25],"height":[173,178,180]}
df = pd.DataFrame(data)
print(df)
# 所有行的和
print(df.sum(axis=1))
# 输出结果
# name age height
# 0 张三 22 173
# 1 李四 23 178
# 2 王五 25 180
# 0 195
# 1 204
# 2 205
# dtype: int64
在例子中,首先创建了一个包含三行的DataFrame。然后,通过调用df.sum(axis=1)
方法对每行进行求和,得到了每行的总和。