下面是Python中pandas.read_excel详细介绍的完整实例教程。
1. pandas.read_excel()的介绍
pandas
是 Python 语言下的一个开源数据分析包,常用于数据处理、清洗和建模等任务。而 pandas.read_excel()
相应地则是 pandas
中用来读取 Excel 文件的函数。
在 pandas
中读取 Excel 文件有两种方式,一种是用 pandas.read_excel()
函数读取,另一种是用 pandas.ExcelFile()
函数读取。本文主要介绍第一种方式。
2. pandas.read_excel()的基本使用
pandas.read_excel()
函数可以读取多种格式的 Excel 文件,包括 .xls 和 .xlsx 等,主要的参数如下:
io
:读取文件的路径或文件名(如果文件和脚本在同一目录中,则只需传入文件名即可)。sheet_name
:读取指定的工作表(sheet)的名称或索引号,默认为读取第一个工作表。header
:设置表头所在行的行号,默认为 0,即表头在第一行。names
:为列设置别名(需要传入一个列表),默认为 None,即取表头行的值。index_col
:设置索引所在列的列号或列名,默认为 None,即不使用任何列作为索引。usecols
:需要读取的列号或名称,可以是一个列表或字符串。默认为 None,即读取所有列。nrows
:需要读取的行数。skiprows
:需要忽略的行数。dtype
:设置每一列的数据类型。keep_default_na
:是否保留缺失值的默认标识符,例如 NA 或 NaN。converters
:为指定列设置转换函数(可以是一个字典),例如将字符串类型的‘1,000’转换为浮点类型的1000。
下面是 pandas.read_excel() 的基本使用示例:
import pandas as pd
# 读取 Excel 文件中的第一个工作表数据
df = pd.read_excel('example.xlsx')
# 查看读取到的数据
print(df.head())
3. 示例说明
示例一:读取指定工作表数据
假如我们需要读取 Excel 文件中的第二个工作表数据,可以通过传入参数 sheet_name
指定要读取的工作表名称或索引号。下面是示例代码:
import pandas as pd
# 读取 Excel 文件中的第二个工作表数据
df = pd.read_excel('example.xlsx', sheet_name='Sheet2')
# 查看读取到的数据
print(df.head())
示例二:读取指定列数据
假设我们要读取 Excel 文件中的 ‘Name’ 列和 ‘Age’ 列数据,我们可以通过传入参数 usecols
来指定要读取的列。下面是示例代码:
import pandas as pd
# 读取 Excel 文件中的 'Name' 和 'Age' 两列数据
df = pd.read_excel('example.xlsx', usecols=['Name', 'Age'])
# 查看读取到的数据
print(df.head())
4. 总结
本文主要介绍了 pandas.read_excel()
函数的基本使用及常用参数,同时也给出了两个示例说明。 pandas
是一款非常强大的数据分析工具,读取 Excel 文件只是其众多功能中的一部分,希望本文能为大家在实际应用中提供帮助。