Python Panda中索引和选择 series 的数据

  • Post category:Python

当我们处理 Pandas library 中的数据时,索引和选择 series 的数据是非常重要的。本文将提供完整的攻略,以帮助您学习如何索引和选择 Pandas Series 的数据。

索引 Pandas Series 数据

要访问 Pandas Series 中的数据,需要使用方括号和相应的索引值。例如:

import pandas as pd

# 创建一个Series对象
fruits = pd.Series(['Apple', 'Banana', 'Orange', 'Mango'], index = [1, 2, 3, 4])

# 索引Series中的数据
print(fruits[1])

输出结果为:Apple

这里我们创建了一个 fruits series,并使用索引值访问了第一个元素 Apple

选择 Pandas Series 数据

当需要选择 Pandas Series 数据时,一般使用以下方法:

1. 选择单个元素

可以使用方括号和相应的索引值来访问单个元素。例如:

import pandas as pd

# 创建一个Series对象
fruits = pd.Series(['Apple', 'Banana', 'Orange', 'Mango'], index = [1, 2, 3, 4])

# 选择单个元素
print(fruits[1])

输出结果为:Apple

2. 选择多个元素

可以使用切片或布尔索引来选择多个元素。例如:

import pandas as pd

# 创建一个Series对象
fruits = pd.Series(['Apple', 'Banana', 'Orange', 'Mango'], index = [1, 2, 3, 4])

# 使用切片选择多个元素
print(fruits[1:3])

# 使用布尔索引选择多个元素
print(fruits[fruits == 'Banana'])

输出结果为:

2    Banana
3    Orange
dtype: object
2    Banana
dtype: object

这里我们使用切片选择了第 2-3 个元素 BananaOrange,使用布尔索引选择了元素值等于 Banana 的元素。

示例说明

示例1

下面是一个使用 Pandas series 数据的示例:创建一个包含水果价格的 series 并选择其中的元素。

import pandas as pd

# 创建一个包含水果价格的Series对象
fruit_prices = pd.Series([2.5, 1.99, 3.25, 4.5], index=['Apple', 'Banana', 'Orange', 'Mango'])

# 选择单个元素
print(fruit_prices['Apple'])

# 选择多个元素
print(fruit_prices[['Apple', 'Banana']])

输出结果为:

2.5
Apple     2.50
Banana    1.99
dtype: float64

这里我们创建了一个包含水果价格的 series,然后使用索引值访问了单个元素 Apple。另外,使用切片选择了元素值为 AppleBanana 的元素。

示例2

下面是一个使用 Pandas series 数据的示例:创建一个包含城市温度的 series 并选择其中的元素。

import pandas as pd

# 创建一个包含城市温度的Series对象
city_temperature = pd.Series([22, 30, 25, 18, 27], index=['Beijing', 'Shanghai', 'Guangzhou', 'Chengdu', 'Wuhan'])

# 使用布尔索引选择多个元素
print(city_temperature[city_temperature > 25])

输出结果为:

Shanghai     30
Guangzhou    25
Wuhan        27
dtype: int64

这里我们创建了一个包含城市温度的 series,并使用布尔索引选择元素值大于 25 的元素。