将Excel电子表格加载为pandas DataFrame

  • Post category:Python

加载Excel电子表格为Pandas DataFrame的方式大致可以分为两种,一种是使用pandas.read_excel()方法,另一种则是使用pandas.ExcelFile()方法结合pandas.read_excel()方法。下面将详细说明这两种方式的使用方法及实例说明:

1. 使用pandas.read_excel()方法加载Excel电子表格

pandas.read_excel()方法可以直接读取Excel电子表格,具体方法如下:

import pandas as pd 

df = pd.read_excel('filename.xlsx', sheet_name='Sheet1', header=0)

其中,’filename.xlsx’是Excel电子表格的文件名,’Sheet1’是电子表格中要读取的工作表名称,header=0表示表头所在的行数。

例如,我们有一个名为“test.xlsx”的Excel电子表格,其中有三个工作表Sheet1、Sheet2、Sheet3,每个工作表都有表头,我们要读取Sheet1的数据,代码如下:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1', header=0)
print(df)

输出结果如下:

   ID  Name  Age
0   1   Tom   20
1   2   Bob   22
2   3  John   25
3   4   Sam   30

2. 使用pandas.ExcelFile()方法结合pandas.read_excel()方法加载Excel电子表格

pandas.ExcelFile()方法可以先读取Excel电子表格为一个ExcelFile对象,然后使用pandas.read_excel()方法来读取工作表数据。具体方法如下:

import pandas as pd

xls = pd.ExcelFile('filename.xlsx')
df = pd.read_excel(xls, 'Sheet1', header=0)

其中,’filename.xlsx’是Excel电子表格的文件名,’Sheet1’是电子表格中要读取的工作表名称,header=0表示表头所在的行数。

例如,我们有一个名为“test.xlsx”的Excel电子表格,其中有三个工作表Sheet1、Sheet2、Sheet3,每个工作表都有表头,我们要读取Sheet1的数据,代码如下:

import pandas as pd

xls = pd.ExcelFile('test.xlsx')
df = pd.read_excel(xls, 'Sheet1', header=0)
print(df)

输出结果如下:

   ID  Name  Age
0   1   Tom   20
1   2   Bob   22
2   3  John   25
3   4   Sam   30

总结:以上就是将Excel电子表格加载为Pandas DataFrame的完整攻略,包括了两种方式的使用方法及实例说明。使用Pandas读取Excel电子表格可以很方便的进行数据处理和分析,尤其是对于一些Excel文件中复杂的数据处理,Pandas的功能比Excel更加强大、灵活。