python Pandas库read_excel()参数实例详解

Python Pandas库read_excel()参数实例详解

Python Pandas库提供了一个名叫read_excel()的函数，支持读取并解析Excel文档。该函数提供了多个参数设置，为用户读取特定的数据提供了灵活性和可扩展性。

本文将详细介绍read_excel()函数的参数。

read_excel()参数说明

io

参数类型：字符串，文件路径或URL。
参数说明：提供Excel文件的文件路径或URL。
示例代码：

import pandas as pd

df = pd.read_excel('example.xlsx')
print(df)

sheet_name

参数类型：字符串或整数。
参数说明：指定要读取的sheet页名称或序号。支持输入多种参数类型，如整数、字符串、字符串列表、None等，详见示例。
示例代码：

import pandas as pd

# 读取第二个sheet页
df1 = pd.read_excel('example.xlsx', sheet_name=1)
print(df1)

# 读取多个sheet页
df2 = pd.read_excel('example.xlsx', sheet_name=['sheet1', 'sheet3'])
print(df2)

# 读取所有sheet页
df3 = pd.read_excel('example.xlsx', sheet_name=None)
print(df3)

header

参数类型：整数或None。
参数说明：输入0表示将第一行作为表头，输入None表示不将第一行作为表头。
示例代码：

import pandas as pd

# 将第一行做为表头读取
df1 = pd.read_excel('example.xlsx', header=0)
print(df1)

# 不将第一行做为表头读取
df2 = pd.read_excel('example.xlsx', header=None)
print(df2)

index_col

参数类型：整数、字符串、表头的名称或None。
参数说明：指定哪些列应该作为索引。若为整数或表头名称，则表示将该列作为单个索引，若为字符串列表，则一次将这些列组合成多级索引。若为None，则表示不使用索引。
示例代码：

import pandas as pd

# 读取第一列做为索引
df1 = pd.read_excel('example.xlsx', index_col=0)
print(df1)

# 读取 'A' 和 'C' 两列做为多级索引
df2 = pd.read_excel('example.xlsx', index_col=['A', 'C'])
print(df2)

# 不将行设置为索引
df3 = pd.read_excel('example.xlsx', index_col=None)
print(df3)

usecols

参数类型：字符串列表，整数、字符串或None。
参数说明：设置需要读取的列。支持字符串列表、整数和字符串类型的混合输入，详见示例。若为None，则表示读取所有列。
示例代码：

import pandas as pd

# 读取A、B、D、E 列
df1 = pd.read_excel('example.xlsx', usecols=['A', 'B', 'D', 'E'])
print(df1)

# 读取第3列和第5列
df2 = pd.read_excel('example.xlsx', usecols=[2, 4])
print(df2)

# 读取所有列
df3 = pd.read_excel('example.xlsx', usecols=None)
print(df3)

nrows

参数类型：整数或None。
参数说明：设置要读取的行数。若为None，则表示读取所有行。
示例代码：

import pandas as pd

# 读取前10行
df1 = pd.read_excel('example.xlsx', nrows=10)
print(df1)

# 读取所有行
df2 = pd.read_excel('example.xlsx', nrows=None)
print(df2)

示例

本节将在示例数据集 example.xlsx 中演示以上参数的应用。

示例1：读取第二个 sheet 页，将第一行做为表头，读取第一列做为索引

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name=1, header=0, index_col=0)
print(df)

输出结果：

  name class  score1  score2
No                           
3   张三     1      98      70
4   李四     1      92      65
5   王五     2      89      87
6   赵六     2      82      88

示例2：读取所有 sheet 页，将所有行、列读取进来，在python内部筛选

import pandas as pd

#读取整个excel文件
df_all = pd.read_excel('example.xlsx', sheet_name=None, header=None)
#指定下标筛选结果
df1 = df_all[0].iloc[:, :2] #取前两列及所有行
df2 = df_all[1] #取第二个Sheet页
df3 = df_all[2].drop([0]) # 去除第一行

#输出结果
print(df1)
print(df2)
print(df3)

输出结果：

        0         1
0  header1      NaN
1        1      df 1
2        2      df 2
3        3      df 3
4        4      df 4
   0       1       2       3
0  A       B       C       D
1  1  value1  value2  value3
2  2  value4  value5  value6
3  3  value7  value8  value9
            0       1       2       3
1         A1     B1      C1      D1
2         A2     B2      C2      D2
3         A3     B3      C3      D3
4         A4     B4      C4      D4
5         A5     B5      C5      D5
6         A6     B6      C6      D6
7         A7     B7      C7      D7
8         A8     B8      C8      D8
9         A9     B9      C9      D9
10       A10    B10     C10     D10
11       A11    B11     C11     D11
12       A12    B12     C12     D12
13       A13    B13     C13     D13

至此，本文已经介绍了Pandas库read_excel()函数的各个参数及其用法，希望能对您的工作和学习有所帮助。

Python Pandas库read_excel()参数实例详解

read_excel()参数说明

io

sheet_name

header

index_col

usecols

nrows

示例

示例1：读取第二个 sheet 页，将第一行做为表头，读取第一列做为索引

示例2：读取所有 sheet 页，将所有行、列读取进来，在python内部筛选

你可能也喜欢

详解Python 移动或复制文件和目录

Python实现归一化算法详情

数据仓库和操作数据库的区别