详解pandas.str.strip()(去除字符串空格)函数使用方法

  • Post category:Python

pandas.str.strip()方法用于删除Series或DataFrame中的字符串数据左右两端的空格或其他字符。使用这个方法可以将一些不必要的字符去除,使数据更加清洁。此外,该方法具有很好的性能,可以快速处理大规模的数据。

pandas.str.strip()方法的使用方法如下:

Series.str.strip(to_strip=None)

其中,to_strip参数表示要删除的字符,可以是字符,字符串或者正则表达式。

下面是两个具体的实例:

  1. 删除字符串中的空格

假设我们有一个数据集包含了姓名和城市两列,但是姓名和城市的左右两端有许多空格。我们可以用pandas.str.strip()方法去除这些空格。

import pandas as pd

data = pd.DataFrame({'name': ['      Tom   ', 'Jerry     ', '   Mary', '   John  '], 'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']})
print(data)

data['name'] = data['name'].str.strip()
print(data)

运行结果:

           name       city
0          Tom     Beijing
1       Jerry    Shanghai
2          Mary  Guangzhou
3        John     Shenzhen

     name       city
0     Tom     Beijing
1  Jerry    Shanghai
2     Mary  Guangzhou
3    John    Shenzhen

可以看到,经过.strip()方法处理后,姓名中左右两端的空格已被删除,使数据更加清洁。

  1. 删除字符串中的特殊字符

假设现在我们有一个数据集中包含了网站上的若干文章标题,但是标题中存在特殊字符“*”,我们要将这些字符删除。我们可以用to_strip参数实现。

import pandas as pd

data = pd.DataFrame({'title': ['***如何学好Python***', 'Python和Java的异同', '利用Python进行数据分析']})
print(data)

data['title'] = data['title'].str.strip('*')
print(data)

运行结果:

                    title
0     ***如何学好Python***
1          Python和Java的异同
2       利用Python进行数据分析

                  title
0          如何学好Python
1        Python和Java的异同
2     利用Python进行数据分析

可以看到,将参数to_strip设置为“*”后,我们成功去除了标题中的特殊字符,得到了干净的标题数据。

以上是pandas.str.strip()方法的使用方法及实例攻略,你有任何问题需要说明吗?