创建Pandas系列数据的平均值和标准偏差

  • Post category:Python

创建Pandas系列数据的平均值和标准偏差主要利用了Pandas中的两个函数——mean和std,本文将详细讲解它们的使用方法。

创建Pandas系列数据

在使用mean和std函数之前,我们需要先创建一个Pandas系列数据。可以通过以下代码创建一个简单的Pandas系列数据:

import pandas as pd
import numpy as np

data = pd.Series(np.random.randn(5))
print(data)

上述代码中,使用np.random.randn(5)生成了一个包含5个随机数的NumPy数组,然后使用pd.Series()将其转换成Pandas系列数据,并将其打印输出。其中,print语句的输出结果如下所示:

0   -1.101002
1   -1.011986
2   -0.450095
3    0.371335
4    1.045431
dtype: float64

计算平均值

有了Pandas系列数据之后,我们就可以使用mean函数计算其平均值。可以通过以下代码计算上文中所创建的Pandas系列数据的平均值:

mean = data.mean()
print(mean)

上述代码中,使用data.mean()计算了上文中所创建的Pandas系列数据的平均值,并将其打印输出。其中,print语句的输出结果如下所示:

-0.22908363394

可以看到,上述代码输出了上文中所创建的Pandas系列数据的平均值。需要注意的是,mean函数返回的是一个数值,而不是一个Series对象。

计算标准偏差

在计算了平均值之后,我们可以使用std函数计算Pandas系列数据的标准偏差。可以通过以下代码计算上文中所创建的Pandas系列数据的标准偏差:

std = data.std()
print(std)

上述代码中,使用data.std()计算了上文中所创建的Pandas系列数据的标准偏差,并将其打印输出。其中,print语句的输出结果如下所示:

0.834195259167

可以看到,上述代码输出了上文中所创建的Pandas系列数据的标准偏差。需要注意的是,std函数返回的同样是一个数值。

示例

考虑以下示例,通过四行代码计算了一个DataFrame中每一列的平均值和标准偏差,并将结果保存到了另一个DataFrame中:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5, 3), columns=['a', 'b', 'c'])
df_mean_std = pd.DataFrame({'mean': df.mean(), 'std': df.std()})
print(df_mean_std)

上述代码中,通过pd.DataFrame(np.random.randn(5, 3), columns=[‘a’, ‘b’, ‘c’])生成了一个包含5行3列随机数的DataFrame,然后通过df.mean()和df.std()计算了每一列的平均值和标准偏差,并将结果保存到了另一个DataFrame中。其中,打印输出的结果如下所示:

       mean       std
a -0.357080  0.572313
b  0.934568  0.343530
c  0.315606  1.186092

可以看到,df_mean_std中保存了每一列的平均值和标准偏差。