pandas.read_excel()是pandas库中用于读取Excel文件的函数,其作用是将Excel文件中的数据读入到一个DataFrame对象中,便于进行数据处理和分析。下面我们来详细了解它的使用方法。
读取Excel文件的基本语法
使用pandas.read_excel()函数读取Excel文件的基本语法如下:
import pandas as pd
df = pd.read_excel('文件名.xlsx', sheet_name='工作表名')
其中,第一个参数为Excel文件名,可以是相对路径或者绝对路径,第二个参数sheet_name表示读取Excel文件的哪张工作表,它可以是工作表名(字符串类型),也可以是工作表的索引(从0开始)。
参数详解
除了上面的两个参数,pandas.read_excel()函数还支持一些其他的参数,下面看一下常用的几个参数:
header
指定Excel文件中作为列名的行。默认为0,表示使用第一行作为列名。如果设置为None,表示读入所有行,并将它们作为数据的一部分。
index_col
指定Excel文件中作为行索引的列。可以设置为列名(字符串类型)或列号(从0开始的整数)。
usecols
仅读取Excel文件中的指定列,可以是列名(字符串类型)或列号(从0开始的整数),多列用列表表示。
dtype
数据类型,可以接收一个字典,指定每一列的数据类型。
na_values
将某些值视为缺失值处理。
nrows
指定读取的行数。
实例一
现在我们来看一个实际的例子,读取Excel文件中的一个工作表,代码如下所示:
import pandas as pd
df = pd.read_excel('sales.xlsx') # 读取sales.xlsx文件
print(df.head()) # 打印前5行数据
上面的代码中,我们没有指定sheet_name参数,默认读取Excel文件中的第一个工作表。
实例二
我们再来看一个例子,读取Excel文件中的指定工作表的指定列,并将指定列的数据类型转换为字符串类型。代码如下所示:
import pandas as pd
df = pd.read_excel('sales.xlsx', sheet_name='2021年销售数据', usecols=['订单号', '商品名称', '数量'], dtype={'订单号': str, '数量': str})
print(df.head()) # 打印前5行数据
上面的代码中,我们通过usecols参数指定只读取Excel文件中的‘订单号’、‘商品名称’和‘数量’这三列,并且将‘订单号’和‘数量’列的数据类型转换为字符串类型。
以上就是pandas.read_excel()的作用、基本语法和常用参数的介绍,相信读完这篇攻略,大家已经掌握了如何使用pandas.read_excel()读取Excel文件了。