Python 中pandas.read_excel详细介绍

  • Post category:Python

下面是Python中pandas.read_excel详细介绍的完整实例教程。

1. pandas.read_excel()的介绍

pandas 是 Python 语言下的一个开源数据分析包,常用于数据处理、清洗和建模等任务。而 pandas.read_excel() 相应地则是 pandas 中用来读取 Excel 文件的函数。

pandas 中读取 Excel 文件有两种方式,一种是用 pandas.read_excel() 函数读取,另一种是用 pandas.ExcelFile() 函数读取。本文主要介绍第一种方式。

2. pandas.read_excel()的基本使用

pandas.read_excel() 函数可以读取多种格式的 Excel 文件,包括 .xls 和 .xlsx 等,主要的参数如下:

  • io:读取文件的路径或文件名(如果文件和脚本在同一目录中,则只需传入文件名即可)。
  • sheet_name:读取指定的工作表(sheet)的名称或索引号,默认为读取第一个工作表。
  • header:设置表头所在行的行号,默认为 0,即表头在第一行。
  • names:为列设置别名(需要传入一个列表),默认为 None,即取表头行的值。
  • index_col:设置索引所在列的列号或列名,默认为 None,即不使用任何列作为索引。
  • usecols:需要读取的列号或名称,可以是一个列表或字符串。默认为 None,即读取所有列。
  • nrows:需要读取的行数。
  • skiprows:需要忽略的行数。
  • dtype:设置每一列的数据类型。
  • keep_default_na:是否保留缺失值的默认标识符,例如 NA 或 NaN。
  • converters:为指定列设置转换函数(可以是一个字典),例如将字符串类型的‘1,000’转换为浮点类型的1000。

下面是 pandas.read_excel() 的基本使用示例:

import pandas as pd

# 读取 Excel 文件中的第一个工作表数据
df = pd.read_excel('example.xlsx')

# 查看读取到的数据
print(df.head())

3. 示例说明

示例一:读取指定工作表数据

假如我们需要读取 Excel 文件中的第二个工作表数据,可以通过传入参数 sheet_name 指定要读取的工作表名称或索引号。下面是示例代码:

import pandas as pd

# 读取 Excel 文件中的第二个工作表数据
df = pd.read_excel('example.xlsx', sheet_name='Sheet2')

# 查看读取到的数据
print(df.head())

示例二:读取指定列数据

假设我们要读取 Excel 文件中的 ‘Name’ 列和 ‘Age’ 列数据,我们可以通过传入参数 usecols 来指定要读取的列。下面是示例代码:

import pandas as pd

# 读取 Excel 文件中的 'Name' 和 'Age' 两列数据
df = pd.read_excel('example.xlsx', usecols=['Name', 'Age'])

# 查看读取到的数据
print(df.head())

4. 总结

本文主要介绍了 pandas.read_excel() 函数的基本使用及常用参数,同时也给出了两个示例说明。 pandas 是一款非常强大的数据分析工具,读取 Excel 文件只是其众多功能中的一部分,希望本文能为大家在实际应用中提供帮助。