在Pandas数据框架中获取一个列的频率计数

  • Post category:Python

获取一个列的频率计数在Pandas数据框架中非常简单。我们可以使用value_counts()函数来获取频率计数。下面是详细的攻略:

  1. 载入必要的库和数据

首先,我们需要先加载Pandas库,并读取数据到pandas数据框架中来进行操作。我们在这里以读取一个csv文件为例,代码如下:

import pandas as pd

df = pd.read_csv("example.csv")
  1. 使用value_counts()函数获取频率计数

一个pandas数据框架包含多个列,我们需要指定需要获取频率计数的列。例如,在example.csv文件中,我们有一个名为”gender”的列,我们要获取这个列的频率计数,可以使用以下代码:

gender_counts = df["gender"].value_counts()

这将返回一个pandas数据框架,其中包含各个值的频率及其对应的数量。

  1. 打印结果

最后,我们可以使用print函数将结果打印出来。代码如下:

print("Gender Counts:\n", gender_counts)

这将打印出结果,其中每一行代表一个值及其对应的数量:

Gender Counts:
 F    18
M    12
Name: gender, dtype: int64

这里的结果中,F代表female,M代表male,int64代表数据类型为64位整数。我们可以看到,female出现了18次,而male出现了12次。

简单来说,通过以上三个步骤,我们就可以很轻松地在pandas数据框架中获取一个列的频率计数了。