创建Pandas系列数据的平均值和标准偏差主要利用了Pandas中的两个函数——mean和std,本文将详细讲解它们的使用方法。
创建Pandas系列数据
在使用mean和std函数之前,我们需要先创建一个Pandas系列数据。可以通过以下代码创建一个简单的Pandas系列数据:
import pandas as pd
import numpy as np
data = pd.Series(np.random.randn(5))
print(data)
上述代码中,使用np.random.randn(5)生成了一个包含5个随机数的NumPy数组,然后使用pd.Series()将其转换成Pandas系列数据,并将其打印输出。其中,print语句的输出结果如下所示:
0 -1.101002
1 -1.011986
2 -0.450095
3 0.371335
4 1.045431
dtype: float64
计算平均值
有了Pandas系列数据之后,我们就可以使用mean函数计算其平均值。可以通过以下代码计算上文中所创建的Pandas系列数据的平均值:
mean = data.mean()
print(mean)
上述代码中,使用data.mean()计算了上文中所创建的Pandas系列数据的平均值,并将其打印输出。其中,print语句的输出结果如下所示:
-0.22908363394
可以看到,上述代码输出了上文中所创建的Pandas系列数据的平均值。需要注意的是,mean函数返回的是一个数值,而不是一个Series对象。
计算标准偏差
在计算了平均值之后,我们可以使用std函数计算Pandas系列数据的标准偏差。可以通过以下代码计算上文中所创建的Pandas系列数据的标准偏差:
std = data.std()
print(std)
上述代码中,使用data.std()计算了上文中所创建的Pandas系列数据的标准偏差,并将其打印输出。其中,print语句的输出结果如下所示:
0.834195259167
可以看到,上述代码输出了上文中所创建的Pandas系列数据的标准偏差。需要注意的是,std函数返回的同样是一个数值。
示例
考虑以下示例,通过四行代码计算了一个DataFrame中每一列的平均值和标准偏差,并将结果保存到了另一个DataFrame中:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['a', 'b', 'c'])
df_mean_std = pd.DataFrame({'mean': df.mean(), 'std': df.std()})
print(df_mean_std)
上述代码中,通过pd.DataFrame(np.random.randn(5, 3), columns=[‘a’, ‘b’, ‘c’])生成了一个包含5行3列随机数的DataFrame,然后通过df.mean()和df.std()计算了每一列的平均值和标准偏差,并将结果保存到了另一个DataFrame中。其中,打印输出的结果如下所示:
mean std
a -0.357080 0.572313
b 0.934568 0.343530
c 0.315606 1.186092
可以看到,df_mean_std中保存了每一列的平均值和标准偏差。