从Pandas数据框架的某一列获取唯一值

  • Post category:Python

获取 Pandas 数据框架某一列的唯一值,可以使用 unique() 方法,该方法返回列中的所有不同值。下面是详细攻略过程:

  1. 读取数据:首先,我们需要使用 Pandas 读取数据。可以使用 read_csv() 方法读取一个 CSV 文件,例如:
import pandas as pd

df = pd.read_csv('data.csv')
  1. 选择列:然后,我们需要选择我们想要获取唯一值的那一列。可以使用 data[‘column’] 的方式来选择,例如:
# 假设我们要选择 name 这一列
names = df['name']
  1. 获取唯一值:我们可以直接在选定的列上使用 unique() 方法来获取唯一值。例如:
unique_names = names.unique()
print(unique_names)

这将打印出 names 列中的所有不同的值。

下面是一个完整的例子,其中我们读取了一个包含成绩信息的 CSV 文件,并且获取了唯一的班级名字列表:

import pandas as pd

# 读取数据
df = pd.read_csv('scores.csv')

# 获取班级名字列
class_names = df['class']

# 获取唯一值
unique_class_names = class_names.unique()

# 打印结果
print(unique_class_names)

输出:

['Class A' 'Class B' 'Class C']

这个例子中,我们使用了 Pandas 读取了一个包含成绩信息的 CSV 文件,并且选择了班级名字列。然后,我们使用 unique() 方法获取了这一列的唯一值,并将结果打印出来。