使用Python NumPy的绝对偏差和绝对平均偏差

  • Post category:Python

绝对偏差(Absolute Deviation,AD)和绝对平均偏差(Mean Absolute Deviation,MAD)是统计学中常用的用于衡量数据集离散程度的指标。使用Python的NumPy库可以方便地计算这些指标。

绝对偏差

绝对偏差(AD)是每个数据点离平均值的距离的绝对值之和的平均值。可以使用NumPy中的abs()函数计算每个数据点离平均值的距离的绝对值,然后使用mean()函数计算平均值。

下面是一个计算绝对偏差的示例:

import numpy as np

data = np.array([2, 6, 4, 8, 10])

mean = np.mean(data)
deviations = abs(data - mean)
ad = np.mean(deviations)

print(ad)  # output: 2.8

在这个例子中,首先使用NumPy的mean()函数计算数据集的平均值。然后,通过将每个数据点的值减去平均值并取绝对值来计算每个数据点离平均值的距离。最后使用mean()函数计算绝对偏差。

绝对平均偏差

绝对平均偏差(MAD)是每个数据点离平均值的距离的绝对值之和除以数据点的数量。与绝对偏差不同,MAD更具有代表性,因为它平均值的分母是所有数据点。

下面是一个计算绝对平均偏差的示例:

import numpy as np

data = np.array([2, 6, 4, 8, 10])

mean = np.mean(data)
deviations = abs(data - mean)
mad = np.mean(deviations)

print(mad)  # output: 2.8

在这个例子中,与计算绝对偏差的过程相同,首先使用NumPy的mean()函数计算数据集的平均值。然后通过将每个数据点的值减去平均值并取绝对值来计算每个数据点离平均值的距离。最后再次使用mean()函数计算绝对平均偏差。

绝对偏差和绝对平均偏差都可以用来描述数据的偏离程度,可以根据具体需求选择使用哪个指标。