Pandas求平均数和中位数的方法实例
Pandas是Python中常用的数据分析库,它提供了很多方便的数据读取、处理、计算等功能。其中计算平均数和中位数是很常见的操作,下面介绍两种方法。
方法一:使用pandas.DataFrame.mean()和pandas.DataFrame.median()方法
pandas.DataFrame.mean()可以计算出一个DataFrame中所有数值列的平均值,而pandas.DataFrame.median()可以计算出所有数值列的中位数。
以一份名为student.csv的学生数据为例,代码如下:
import pandas as pd
df = pd.read_csv('student.csv')
print('平均数:')
print(df.mean())
print('中位数:')
print(df.median())
运行结果如下:
平均数:
number 3.000000
math 68.666667
english 73.333333
dtype: float64
中位数:
number 3.0
math 69.0
english 74.0
dtype: float64
如上所示,mean()方法输出了所有数值列的平均值,median()方法输出了所有数值列的中位数。
方法二:使用numpy库中的函数计算平均数和中位数
除了pandas内置的方法,我们还可以使用numpy库中的函数计算平均数和中位数。下面是一个例子,你可以参考它:
import pandas as pd
import numpy as np
df = pd.read_csv('student.csv')
print('平均数:')
print(np.mean(df, axis=0))
print('中位数:')
print(np.median(df, axis=0))
在上述代码中,np.mean()和np.median()函数分别计算出所有数值列的平均值和中位数,并在axis=0的方向上进行计算。运行结果如下:
平均数:
[ 3. 68.66666667 73.33333333]
中位数:
[ 3. 69. 74.]
总结
本文介绍了计算平均数和中位数的两种方法。除了本文提到的两种方法外,还有很多方法可以完成这个任务,例如使用numpy库中的其他函数、调用pandas.DataFrame.describe()方法等。在实际工作中,你可以根据数据量和需求选择更适合自己的方法。