下面是“如何用Python合并多个Excel文件”的完整实例教程。
准备工作
在开始之前,需要安装 pandas
模块,可以使用以下命令进行安装:
pip install pandas
步骤一:读取Excel文件
使用 pandas
模块可以很容易地读取 Excel 文件。以下是读取 Excel 文件的示例代码:
import pandas as pd
# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')
这里使用 pd.read_excel()
函数读取了两个 Excel 文件,并将其存储到 df1
和 df2
变量中。
步骤二:合并Excel文件
使用 pandas
模块的 concat
函数可以很方便地合并多个 Excel 文件。以下是合并 Excel 文件的示例代码:
# 合并两个 Excel 文件
merged_df = pd.concat([df1, df2])
# 将合并后的结果保存到新的 Excel 文件中
merged_df.to_excel('merged_file.xlsx', index=None, header=True)
这里使用 pd.concat()
函数将 df1
和 df2
合并成一个新的 DataFrame 对象,然后使用 to_excel()
函数将合并后的结果保存到新的 Excel 文件中。
示例说明
示例一
假设我们有 3 个 Excel 文件,文件名分别为 file1.xlsx
、file2.xlsx
和 file3.xlsx
,这 3 个文件都包含两列数据:Name
和 Age
。我们需要将这三个 Excel 文件合并成一个新的 Excel 文件。
以下是示例代码:
import pandas as pd
# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')
# 读取第三个 Excel 文件
df3 = pd.read_excel('file3.xlsx')
# 合并三个 Excel 文件
merged_df = pd.concat([df1, df2, df3])
# 将合并后的结果保存到新的 Excel 文件中
merged_df.to_excel('merged_file.xlsx', index=None, header=True)
这里使用 pd.read_excel()
函数读取了三个 Excel 文件,使用 pd.concat()
函数将这三个文件合并成一个新的 DataFrame 对象,然后使用 to_excel()
函数将合并后的结果保存到新的 Excel 文件中。
示例二
假设我们有 2 个 Excel 文件,文件名分别为 file1.xlsx
和 file2.xlsx
,这两个文件都包含两列数据:Name
和 Score
。我们需要将这两个 Excel 文件合并成一个新的 Excel 文件,并按照 Score
进行排序。
以下是示例代码:
import pandas as pd
# 读取第一个 Excel 文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个 Excel 文件
df2 = pd.read_excel('file2.xlsx')
# 合并两个 Excel 文件
merged_df = pd.concat([df1, df2])
# 按照 Score 排序
sorted_df = merged_df.sort_values(by='Score', ascending=False)
# 将排序后的结果保存到新的 Excel 文件中
sorted_df.to_excel('sorted_file.xlsx', index=None, header=True)
这里使用 pd.read_excel()
函数读取了两个 Excel 文件,使用 pd.concat()
函数将这两个文件合并成一个新的 DataFrame 对象,然后使用 sort_values()
函数按照 Score
进行排序,最后使用 to_excel()
函数将排序后的结果保存到新的 Excel 文件中。