获取 Pandas 数据框架某一列的唯一值,可以使用 unique() 方法,该方法返回列中的所有不同值。下面是详细攻略过程:
- 读取数据:首先,我们需要使用 Pandas 读取数据。可以使用 read_csv() 方法读取一个 CSV 文件,例如:
import pandas as pd
df = pd.read_csv('data.csv')
- 选择列:然后,我们需要选择我们想要获取唯一值的那一列。可以使用 data[‘column’] 的方式来选择,例如:
# 假设我们要选择 name 这一列
names = df['name']
- 获取唯一值:我们可以直接在选定的列上使用 unique() 方法来获取唯一值。例如:
unique_names = names.unique()
print(unique_names)
这将打印出 names 列中的所有不同的值。
下面是一个完整的例子,其中我们读取了一个包含成绩信息的 CSV 文件,并且获取了唯一的班级名字列表:
import pandas as pd
# 读取数据
df = pd.read_csv('scores.csv')
# 获取班级名字列
class_names = df['class']
# 获取唯一值
unique_class_names = class_names.unique()
# 打印结果
print(unique_class_names)
输出:
['Class A' 'Class B' 'Class C']
这个例子中,我们使用了 Pandas 读取了一个包含成绩信息的 CSV 文件,并且选择了班级名字列。然后,我们使用 unique() 方法获取了这一列的唯一值,并将结果打印出来。