详解pandas.read_excel()（读取Excel文件）函数使用方法

pandas.read_excel()是pandas库中用于读取Excel文件的函数，其作用是将Excel文件中的数据读入到一个DataFrame对象中，便于进行数据处理和分析。下面我们来详细了解它的使用方法。

读取Excel文件的基本语法

使用pandas.read_excel()函数读取Excel文件的基本语法如下：

import pandas as pd
df = pd.read_excel('文件名.xlsx', sheet_name='工作表名')

其中，第一个参数为Excel文件名，可以是相对路径或者绝对路径，第二个参数sheet_name表示读取Excel文件的哪张工作表，它可以是工作表名（字符串类型），也可以是工作表的索引（从0开始）。

参数详解

除了上面的两个参数，pandas.read_excel()函数还支持一些其他的参数，下面看一下常用的几个参数：

header

指定Excel文件中作为列名的行。默认为0，表示使用第一行作为列名。如果设置为None，表示读入所有行，并将它们作为数据的一部分。

index_col

指定Excel文件中作为行索引的列。可以设置为列名（字符串类型）或列号（从0开始的整数）。

usecols

仅读取Excel文件中的指定列，可以是列名（字符串类型）或列号（从0开始的整数），多列用列表表示。

dtype

数据类型，可以接收一个字典，指定每一列的数据类型。

na_values

将某些值视为缺失值处理。

nrows

指定读取的行数。

实例一

现在我们来看一个实际的例子，读取Excel文件中的一个工作表，代码如下所示：

import pandas as pd
df = pd.read_excel('sales.xlsx')  # 读取sales.xlsx文件
print(df.head())  # 打印前5行数据

上面的代码中，我们没有指定sheet_name参数，默认读取Excel文件中的第一个工作表。

实例二

我们再来看一个例子，读取Excel文件中的指定工作表的指定列，并将指定列的数据类型转换为字符串类型。代码如下所示：

import pandas as pd
df = pd.read_excel('sales.xlsx', sheet_name='2021年销售数据', usecols=['订单号', '商品名称', '数量'], dtype={'订单号': str, '数量': str})
print(df.head())  # 打印前5行数据

上面的代码中，我们通过usecols参数指定只读取Excel文件中的‘订单号’、‘商品名称’和‘数量’这三列，并且将‘订单号’和‘数量’列的数据类型转换为字符串类型。

以上就是pandas.read_excel()的作用、基本语法和常用参数的介绍，相信读完这篇攻略，大家已经掌握了如何使用pandas.read_excel()读取Excel文件了。

读取Excel文件的基本语法

参数详解

header

index_col

usecols

dtype

na_values

nrows

实例一

实例二

你可能也喜欢

详解pandas.DataFrame.to_sql()（将数据框写入SQL数据库）函数使用方法

详解pandas.Series.str.strip()（去除序列中的字符串空格）函数使用方法

详解pandas.concat()（合并数据框）函数使用方法