如何用python合并多个excel文件

  • Post category:Python

下面是“如何用Python合并多个Excel文件”的完整实例教程。

准备工作

在开始之前,需要安装 pandas 模块,可以使用以下命令进行安装:

pip install pandas

步骤一:读取Excel文件

使用 pandas 模块可以很容易地读取 Excel 文件。以下是读取 Excel 文件的示例代码:

import pandas as pd

# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')

这里使用 pd.read_excel() 函数读取了两个 Excel 文件,并将其存储到 df1df2 变量中。

步骤二:合并Excel文件

使用 pandas 模块的 concat 函数可以很方便地合并多个 Excel 文件。以下是合并 Excel 文件的示例代码:

# 合并两个 Excel 文件
merged_df = pd.concat([df1, df2])

# 将合并后的结果保存到新的 Excel 文件中
merged_df.to_excel('merged_file.xlsx', index=None, header=True)

这里使用 pd.concat() 函数将 df1df2 合并成一个新的 DataFrame 对象,然后使用 to_excel() 函数将合并后的结果保存到新的 Excel 文件中。

示例说明

示例一

假设我们有 3 个 Excel 文件,文件名分别为 file1.xlsxfile2.xlsxfile3.xlsx,这 3 个文件都包含两列数据:NameAge。我们需要将这三个 Excel 文件合并成一个新的 Excel 文件。

以下是示例代码:

import pandas as pd

# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')

# 读取第三个 Excel 文件
df3 = pd.read_excel('file3.xlsx')

# 合并三个 Excel 文件
merged_df = pd.concat([df1, df2, df3])

# 将合并后的结果保存到新的 Excel 文件中
merged_df.to_excel('merged_file.xlsx', index=None, header=True)

这里使用 pd.read_excel() 函数读取了三个 Excel 文件,使用 pd.concat() 函数将这三个文件合并成一个新的 DataFrame 对象,然后使用 to_excel() 函数将合并后的结果保存到新的 Excel 文件中。

示例二

假设我们有 2 个 Excel 文件,文件名分别为 file1.xlsxfile2.xlsx,这两个文件都包含两列数据:NameScore。我们需要将这两个 Excel 文件合并成一个新的 Excel 文件,并按照 Score 进行排序。

以下是示例代码:

import pandas as pd

# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')

# 合并两个 Excel 文件
merged_df = pd.concat([df1, df2])

# 按照 Score 排序
sorted_df = merged_df.sort_values(by='Score', ascending=False)

# 将排序后的结果保存到新的 Excel 文件中
sorted_df.to_excel('sorted_file.xlsx', index=None, header=True)

这里使用 pd.read_excel() 函数读取了两个 Excel 文件,使用 pd.concat() 函数将这两个文件合并成一个新的 DataFrame 对象,然后使用 sort_values() 函数按照 Score 进行排序,最后使用 to_excel() 函数将排序后的结果保存到新的 Excel 文件中。