Python数据分析之pandas读取数据

  • Post category:Python

下面我来详细讲解一下“Python数据分析之pandas读取数据”的完整实例教程。

pandas读取数据

介绍

在数据分析和处理中,我们需要读取各种各样的数据,并进行处理和分析。pandas提供了非常方便的数据读取功能,可以读取包括csv、excel、sql等在内的各种格式的数据。

在本篇教程中,我们将介绍pandas的数据读取功能,并通过实例演示如何读取csv文件。

实例

示例1:读取csv文件

在本示例中,我们将演示如何读取csv文件并展示数据。假设我们有一个csv文件,其中包含了若干条数据记录,每条数据记录有id、name和age三个字段,如下所示:

id,name,age
1,Alice,20
2,Bob,22
3,Charlie,25
4,David,30

我们可以使用pandas的read_csv函数读取csv文件,并将其转换为一个类似于Excel表格的对象,称之为DataFrame。示例代码如下:

import pandas as pd

# 读取csv文件
df = pd.read_csv('data.csv')

# 展示数据
print(df)

在代码中,我们使用了pandas的read_csv函数读取了名为data.csv的csv文件,并将其赋值给了一个名为df的DataFrame对象。在读取完成后,我们使用print函数将DataFrame对象打印出来,以便查看数据。运行以上代码,我们将得到以下输出:

   id      name  age
0   1     Alice   20
1   2       Bob   22
2   3   Charlie   25
3   4     David   30

在输出结果中,我们可以看到DataFrame对象以表格形式展示了读取到的数据,其中每一行代表一条数据记录,每个字段分别对应表格的列。

示例2:读取部分数据

在实际数据处理中,往往需要读取数据的部分字段或部分行数据,并进行处理。在本示例中,我们将演示如何读取部分数据。假设我们有一个csv文件,其中包含了若干条数据记录,每条数据记录有id、name、age和gender四个字段,如下所示:

id,name,age,gender
1,Alice,20,Female
2,Bob,22,Male
3,Charlie,25,Male
4,David,30,Male

我们可以使用pandas的read_csv函数读取csv文件,并通过指定usecolsnrows参数来读取部分数据。其中usecols参数用于指定需要读取的列(可以使用列的索引或列名),nrows参数用于指定需要读取的行数。示例代码如下:

import pandas as pd

# 读取csv文件,读取id、name和gender列的前三行数据
df = pd.read_csv('data.csv', usecols=['id', 'name', 'gender'], nrows=3)

# 展示数据
print(df)

在代码中,我们使用了pandas的read_csv函数读取了名为data.csv的csv文件,并使用usecols参数指定了需要读取的列为idnamegender。同时,我们使用nrows参数指定了需要读取的行数为3。在读取完成后,我们使用print函数将DataFrame对象打印出来,以便查看数据。运行以上代码,我们将得到以下输出:

   id     name  gender
0   1    Alice  Female
1   2      Bob    Male
2   3  Charlie    Male

在输出结果中,我们可以看到DataFrame对象仅包含了选定的三列数据(即idnamegender),并且仅包含前三行数据。