详解pandas.Series.str.upper()(转换序列中的字符串为大写)函数使用方法

  • Post category:Python

pandas.Series.str.upper() 是 Pandas 的 Series 类中的一个字符串方法,用于将 Series 对象中的所有字符串转换为大写形式。

该方法的定义如下:

Series.str.upper(self) -> ~FrameOrSeries

其中,self 表示调用该方法的 Series 对象本身。

该方法返回一个新的 Series 对象,其中包含了原始 Series 对象中所有字符串转换为大写形式后的结果。

下面是一个简单的例子,演示了该方法的基本使用方法:

import pandas as pd

# 构造一个包含字符串的 Series 对象
s = pd.Series(['apple', 'banana', 'cherry'])

# 对 s 所有元素执行大写转换,并输出转换后的结果
result = s.str.upper()
print(result)

输出结果为:

0     APPLE
1    BANANA
2    CHERRY
dtype: object

可以看到,s.str.upper() 方法将原始 Series 对象中的所有字符串转换为了大写形式,并返回了一个新的 Series 对象,保存了转换后的结果。

这里再给出一个稍微复杂一些的例子,为一个包含了姓名和分数两个字段的 DataFrame 对象中的姓名字段执行大写转换:

import pandas as pd

# 构造一个包含姓名和分数两个字段的 DataFrame 对象
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'score': [90, 80, 70]
})

# 对 df 中的 name 列的所有元素执行大写转换
df['name'] = df['name'].str.upper()

# 输出转换后的 DataFrame 对象
print(df)

输出结果为:

       name  score
0     ALICE     90
1       BOB     80
2  CHARLIE     70

可以看到,df['name'].str.upper() 方法将 DataFrame 对象 df 中的 name 列的所有字符串转换为了大写形式,并将转换后的结果更新回了 df 对象中的 name 列。因为这个操作是直接修改了原始对象,所以在输出 df 对象时,可以看到 name 列的结果已经转换为了大写形式。

总的来说,pandas.Series.str.upper() 方法是一个方便快捷的字符串转换工具,能够帮助我们快速将字符串转换为大写形式。在数据清洗、数据预处理等工作中,我们经常需要用到该方法来规范化字符串数据,以达到更好的数据分析效果。