Pandas读取并修改excel的示例代码

  • Post category:Python

以下是一份Pandas读取并修改Excel的示例代码实例教程。

1. 准备工作

在开始之前,需要确保安装了以下依赖项:

  • Python 3.x
  • Pandas库

2. 读取Excel文件

首先,我们需要使用Pandas库中的read_excel()函数读取Excel文件。在本例中,我们将使用一个名为”example.xlsx”的示例文件。以下是示例代码:

import pandas as pd

# 读取Excel文件
df = pd.read_excel("example.xlsx")

# 打印读取的数据
print(df)

在上述代码中,我们使用read_excel()函数读取了”example.xlsx”文件,并将其存储在一个名为df的Pandas DataFrame对象中。

3. 修改Excel文件

一旦我们已经将数据读取到DataFrame对象中,我们就可以在内存中对数据进行修改,然后将数据写回Excel文件中。

以下是一个例子,将”example.xlsx”文件中的数据修改为新的数据,并将结果写回到同一文件中。

import pandas as pd

# 读取Excel文件
df = pd.read_excel("example.xlsx")

# 修改数据
df.loc[0, 'Name'] = '张三'
df.loc[0, 'Age'] = 25

# 写回Excel文件
with pd.ExcelWriter('example.xlsx') as writer:
    df.to_excel(writer)

在上述代码中,我们首先使用read_excel()函数读取Excel文件,然后使用loc[]方法将第一行的”Name”列设置为”张三”,将”Age”列设置为”25″。最后,我们使用ExcelWriter()方法创建一个写Excel文件的对象writer,并使用to_excel()方法将DataFrame对象中的数据写回到Excel文件中。

4. 示例说明

下面是两个示例说明,演示了如何使用Pandas库读取并修改Excel文件。

示例1:批量更新Excel文件中的数据

假设我们有一个包含学生信息的Excel文件,其中每个学生的分数都需要更新。我们可以使用Pandas库批量更新这些数据。

以下是示例代码:

import pandas as pd

# 读取Excel文件
df = pd.read_excel("students_scores.xlsx")

# 修改每个学生的分数
for i in range(len(df)):
    df.loc[i, 'Score'] += 5

# 写回Excel文件
with pd.ExcelWriter('students_scores.xlsx') as writer:
    df.to_excel(writer)

在上述代码中,我们使用read_excel()函数读取”students_scores.xlsx”文件,并使用loc[]方法遍历DataFrame对象中的每个学生,将每个学生的分数加5。最后,我们使用ExcelWriter()方法创建一个写Excel文件的对象,并使用to_excel()方法将更新的数据写回到Excel文件中。

示例2:根据条件过滤Excel文件中的数据

假设我们有一个包含学生信息的Excel文件,我们想要根据学生成绩过滤文件中的行。我们可以使用Pandas库完成此任务。

以下是示例代码:

import pandas as pd

# 读取Excel文件
df = pd.read_excel("students_scores.xlsx")

# 根据条件过滤数据
df = df[df['Score'] >= 80]

# 写回Excel文件
with pd.ExcelWriter('students_scores.xlsx') as writer:
    df.to_excel(writer)

在上述代码中,我们使用read_excel()方法读取Excel文件,并使用条件过滤DataFrame对象中的数据,只保留分数大于等于80的学生信息。最后,我们使用ExcelWriter()方法创建一个写Excel文件的对象,并使用to_excel()方法将更新的数据写回到Excel文件中。

5. 总结

这就是Pandas库读取并修改Excel文件的示例代码,我们介绍了如何使用read_excel()方法读取Excel文件,并将数据存储在DataFrame对象中。然后,我们演示了如何在内存中修改数据并使用to_excel()方法将更新的数据写回到Excel文件中。

这种方法可以用于批量处理大量数据的情况,同时还能根据条件过滤文件中的数据。通过使用这些技术,我们可以加快处理时间并提高数据处理的准确性。