加入Pandas数据框架,通过子串匹配

  • Post category:Python

加入Pandas数据框架并通过子串匹配是Pandas中的常用操作之一,下面我来一步步地讲解这个过程。

加入Pandas数据框架

要使用Pandas,首先需要安装Pandas,如果你还未安装,可以通过以下命令进行安装:

pip install pandas

安装完成后,在代码中导入Pandas:

import pandas as pd

接下来,我们需要有数据来进行操作,这里提供一个简单的数据示例,包含2列数据:姓名(name)和年龄(age)。

name, age
Bob, 18
Alice, 22
Charlie, 20
David, 22
Emily, 19

将数据放在名为example.csv的文件中,使用Pandas读取这个文件,并将其转换为数据框:

df = pd.read_csv('example.csv')

此时,数据就已经被读进了Pandas数据框架中,可以通过以下代码显示数据框的前5行:

print(df.head())

输出结果为:

       name   age
0       Bob    18
1     Alice    22
2   Charlie    20
3     David    22
4     Emily    19

子串匹配

子串匹配是指在一个长字符串中查找是否包含一个给定的短字符串。在Pandas中,可以使用.str.contains()方法进行子串匹配。

下面我们用一个例子来说明如何通过子串匹配来筛选出数据框中包含指定姓名的行。

首先,我们定义需要查找的姓名为”Charlie”,然后使用以下代码实现子串匹配:

df_name = df[df['name'].str.contains('Charlie')]

上述代码中df[‘name’]表示数据框df的name列,.str.contains(‘Charlie’)表示查找name列中是否包含”Charlie”。

接下来,我们打印筛选出来的数据框:

print(df_name)

输出结果为:

       name   age
2   Charlie    20

至此,我们已经成功地通过子串匹配来筛选数据了。

以上就是加入Pandas数据框架以及通过子串匹配进行数据筛选的完整攻略,希望能对你有所帮助。