利用python汇总统计多张Excel

  • Post category:Python

以下是详细讲解“利用Python汇总统计多张Excel”的完整实例教程。

1. 准备工作

在开始之前,首先需要安装pandasopenpyxl库。可以使用以下命令进行安装:

pip install pandas openpyxl

接下来,需要准备多个Excel文件用于演示。这些Excel文件需要包含相同的表头,表头中的列名需要完全相同。

这里我们准备了两个示例Excel文件,分别为example1.xlsxexample2.xlsx。它们所包含的表头和数据如下所示:

example1.xlsx:

Name Age Gender
John Doe 30 Male
Jane Doe 25 Female

example2.xlsx:

Name Age Gender
Bob Smith 40 Male
Alice Johnson 35 Female

2. 读取Excel文件

首先,需要使用pandas库中的read_excel函数读取Excel文件。这个函数可以将Excel文件中的数据转换为DataFrame对象,方便后续的操作。

下面是读取示例文件的示例代码:

import pandas as pd

# 读取example1.xlsx和example2.xlsx文件
df1 = pd.read_excel('example1.xlsx')
df2 = pd.read_excel('example2.xlsx')

# 打印读取结果
print('df1:')
print(df1)
print('df2:')
print(df2)

执行以上代码后,可以看到读取结果如下:

df1:
        Name  Age  Gender
0   John Doe   30    Male
1   Jane Doe   25  Female

df2:
            Name  Age  Gender
0      Bob Smith   40    Male
1  Alice Johnson   35  Female

3. 合并Excel数据

读取完多个Excel文件后,需要将它们的数据合并起来。这里我们使用pandas库中的concat函数进行合并,将多个DataFrame对象合并成一个。

具体来说,可以使用以下代码将示例文件中的数据合并:

# 将df1和df2合并
df_all = pd.concat([df1, df2], axis=0)

# 打印合并结果
print('df_all:')
print(df_all)

执行以上代码后,可以看到合并结果如下:

df_all:
            Name  Age  Gender
0       John Doe   30    Male
1       Jane Doe   25  Female
0      Bob Smith   40    Male
1  Alice Johnson   35  Female

从合并结果可以看出,所有Excel文件中的数据都被合并到了同一个DataFrame对象中。

4. 写入Excel文件

最后,需要将合并后的数据写入Excel文件中。这里我们使用pandas库中的to_excel函数将数据写入Excel文件。

以下示例代码将合并后的df_all数据写入output.xlsx文件中:

# 将df_all写入output.xlsx文件中
df_all.to_excel('output.xlsx', index=False)

# 打印写入结果
print('已将数据写入output.xlsx文件中。')

执行以上代码后,可以看到在当前目录下生成了output.xlsx文件,并且文件中包含了合并后的所有数据。

在实际应用中,还可以根据需要对数据进行处理、过滤、重新排序等操作,最终再将结果写入Excel文件中。

以上就是“利用Python汇总统计多张Excel”的完整实例教程,希望对你有所帮助!