从Pandas数据框架的某一列中获取唯一值

  • Post category:Python

获取Pandas数据框架中某一列的唯一值可以使用Pandas库中的unique()函数。以下是获取唯一值的完整攻略:

1. 导入Pandas库和读取数据

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

2. 查看数据中的唯一值

unique_data = data['column_name'].unique()

print(unique_data)

上述代码中,’column_name’为数据框架中的某一列的名称,数据框架可以使用data[‘column_name’]来选取这一列数据。使用unique()函数来获取这一列的唯一值。最后使用print()函数来输出获取到的唯一值。

3. 查看唯一值数量

如果想要查看每个唯一值的数量,可以使用value_counts()函数。

unique_value_counts = data['column_name'].value_counts()

print(unique_value_counts)

上述代码中,value_counts()函数用于统计唯一值的数量并返回一个包含唯一值数量的新数据框架。最后使用print()函数来输出统计后的结果。

示例

假设我们有一个数据框架,其中包含了一些城市名称和对应的人口数量。现在我们想要获取该数据框架中城市名称的唯一值和每个唯一值的数量。下面就是实现代码:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 获取唯一值
unique_cities = data['city'].unique()

# 查看唯一值数量
unique_city_counts = data['city'].value_counts()

# 输出结果
print(unique_cities)
print(unique_city_counts)

执行上述代码后,我们可以得到以下输出结果:

['Beijing' 'Shanghai' 'Guangzhou' 'Shenzhen']
Shanghai      3
Beijing       2
Guangzhou     2
Shenzhen      1
Name: city, dtype: int64

从输出结果中,我们可以看到该数据框架中城市名称的唯一值以及每个唯一值的数量。