详解pandas.read_excel()(读取Excel文件)函数使用方法

  • Post category:Python

pandas.read_excel()是pandas库中用于读取Excel文件的函数,其作用是将Excel文件中的数据读入到一个DataFrame对象中,便于进行数据处理和分析。下面我们来详细了解它的使用方法。

读取Excel文件的基本语法

使用pandas.read_excel()函数读取Excel文件的基本语法如下:

import pandas as pd
df = pd.read_excel('文件名.xlsx', sheet_name='工作表名')

其中,第一个参数为Excel文件名,可以是相对路径或者绝对路径,第二个参数sheet_name表示读取Excel文件的哪张工作表,它可以是工作表名(字符串类型),也可以是工作表的索引(从0开始)。

参数详解

除了上面的两个参数,pandas.read_excel()函数还支持一些其他的参数,下面看一下常用的几个参数:

header

指定Excel文件中作为列名的行。默认为0,表示使用第一行作为列名。如果设置为None,表示读入所有行,并将它们作为数据的一部分。

index_col

指定Excel文件中作为行索引的列。可以设置为列名(字符串类型)或列号(从0开始的整数)。

usecols

仅读取Excel文件中的指定列,可以是列名(字符串类型)或列号(从0开始的整数),多列用列表表示。

dtype

数据类型,可以接收一个字典,指定每一列的数据类型。

na_values

将某些值视为缺失值处理。

nrows

指定读取的行数。

实例一

现在我们来看一个实际的例子,读取Excel文件中的一个工作表,代码如下所示:

import pandas as pd
df = pd.read_excel('sales.xlsx')  # 读取sales.xlsx文件
print(df.head())  # 打印前5行数据

上面的代码中,我们没有指定sheet_name参数,默认读取Excel文件中的第一个工作表。

实例二

我们再来看一个例子,读取Excel文件中的指定工作表的指定列,并将指定列的数据类型转换为字符串类型。代码如下所示:

import pandas as pd
df = pd.read_excel('sales.xlsx', sheet_name='2021年销售数据', usecols=['订单号', '商品名称', '数量'], dtype={'订单号': str, '数量': str})
print(df.head())  # 打印前5行数据

上面的代码中,我们通过usecols参数指定只读取Excel文件中的‘订单号’、‘商品名称’和‘数量’这三列,并且将‘订单号’和‘数量’列的数据类型转换为字符串类型。

以上就是pandas.read_excel()的作用、基本语法和常用参数的介绍,相信读完这篇攻略,大家已经掌握了如何使用pandas.read_excel()读取Excel文件了。