python pandas库读取excel/csv中指定行或列数据

  • Post category:Python

当使用Python进行数据分析时,pandas库是一个非常有用的工具。其可以轻松读取Excel、CSV等常见数据格式,并对数据进行整合、处理和分析。下面是Python pandas库读取Excel/CSV中指定行或列数据的示例教程,分别介绍基于Excel和CSV文件的读取方法。

读取Excel文件中指定行/列数据

安装及导入pandas库

在这之前,需要确保已经安装了pandas库。如果未安装,可以使用以下命令安装:

pip install pandas

安装完毕后,我们需要先导入pandas库:

import pandas as pd

读取Excel文件

读取Excel文件的过程简单明了,只需要使用pandas库的read_excel()方法即可。

df = pd.read_excel('sample.xlsx')

上述代码会将Excel文件中的数据读取到一个DataFrame对象中,并赋值给变量df。

读取指定行

假设我们需要读取Excel文件的第3行数据,可以使用以下代码:

row = df[2:3]

该代码将会返回一个DataFrame对象,其中包含了Excel文件中第3行数据。

读取指定列

如果我们需要读取Excel文件的第2列数据,可以使用以下代码:

col = df[[df.columns[1]]]

此代码将会返回一个DataFrame对象,其中包含了Excel文件中第2列数据。

示例

以下是完整的示例代码,需要替换sample.xlsx文件路径为有效路径:

import pandas as pd

path = 'sample.xlsx'

# 读取Excel文件
df = pd.read_excel(path)

# 读取第3行数据
row = df[2:3]
print(row)

# 读取第2列数据
col = df[[df.columns[1]]]
print(col)

读取CSV文件中指定行/列数据

读取CSV文件

读取CSV文件的过程同样使用pandas库,只需要使用read_csv()方法即可读取CSV文件并将其转换成DataFrame对象。

df = pd.read_csv('sample.csv')

读取指定行

如果我们需要读取CSV文件的第3行数据,则需要使用iloc属性:

row = df.iloc[[2]]

读取指定列

如果我们需要读取CSV文件的第2列数据,则需要使用iloc属性中的切片功能:

col = df.iloc[:, [1]]

上述代码将会返回一个DataFrame对象,其中包含了CSV文件中第2列的数据。

示例

以下是完整的示例代码,需要替换sample.csv文件路径为有效路径:

import pandas as pd

path = 'sample.csv'

# 读取CSV文件
df = pd.read_csv(path)

# 读取第3行数据
row = df.iloc[[2]]
print(row)

# 读取第2列数据
col = df.iloc[:, [1]]
print(col)

这些示例可以帮助大家理解如何使用pandas库读取Excel/CSV文件中指定行或列的数据。pandas库是Python数据分析的重要工具,如果你经常需要处理或分析数据,建议多加熟练。