如何使用Pandas的Quantile打印系列中超过75%的数值

  • Post category:Python

要使用Pandas的Quantile打印系列中超过75%的数值,首先需要导入Pandas库:

import pandas as pd

接着,我们可以用Pandas创建一个Series,然后使用Quantile函数来打印超过75%的数值。示例代码如下:

data = pd.Series([3, 9, 5, 2, 8, 2, 7, 12, 6, 1, 10, 4])
print(data[data > data.quantile(0.75)])

这段代码中,我们首先创建了一个包含12个数字的Series(变量名为data)。然后,我们使用Quantile函数找到75%的分位数,即data.quantile(0.75)。

接着,我们使用布尔索引(data > data.quantile(0.75))来筛选出Series中大于75%分位数的元素。最后,我们将这些元素打印出来。

运行上面的代码,输出结果为:

1      10
7      12
dtype: int64

这表明,在data中,超过75%分位数的数值分别是10和12。

除了Series之外,我们还可以在DataFrame中使用Quantile函数来查找每一列中超过75%分位数的数据。示例代码如下:

data = {'Student A': [80, 75, 85, 90, 95],
        'Student B': [60, 70, 80, 90, 95],
        'Student C': [70, 80, 85, 95, 98]}
df = pd.DataFrame(data)
print(df[df > df.quantile(0.75)])

这段代码中,我们首先创建了一个包含3个学生的DataFrame(变量名为df),每个学生有5个成绩。然后,我们使用Quantile函数找到每一列的75%分位数。

最后,我们使用布尔索引(df > df.quantile(0.75))来筛选出每一列中大于75%分位数的元素。最后,我们将这些元素打印出来。

运行上面的代码,输出结果为:

   Student A  Student B  Student C
0         80        NaN        NaN
1         75       70.0        80.0
2         85       80.0        85.0
3         90       90.0        95.0
4         95       95.0        98.0

这表明,在df中,每一列中超过75%分位数的数据分别是:

  • 学生A的成绩为80、85、90、95。
  • 学生B的成绩为70、80、90、95。
  • 学生C的成绩为80、85、95、98。