Python 数据处理库 pandas 入门教程基本操作

  • Post category:Python

Python数据处理库pandas入门教程基本操作

简介

Pandas是Python的一个开源库,专门用于数据分析和数据处理。它提供了一种灵活的、高效的、快速的数据结构,可以让您轻松地处理和修改数据,以及访问各种来源的数据。

安装

使用Pandas之前,您需要首先安装它。您可以使用以下命令来安装Pandas:

pip install pandas

创建DataFrame

Pandas的核心数据结构是DataFrame,它可以像表格一样操作数据。下面我们将介绍如何创建DataFrame。

从list创建

您可以使用Python的list来创建一个DataFrame。下面是一个通过list创建DataFrame的示例:

import pandas as pd

# 创建一个list
data = [['Alex', 10], ['Bob', 12], ['Clarke', 13]]

# 将list转换为DataFrame
df = pd.DataFrame(data, columns=['Name', 'Age'])

# 打印输出DataFrame
print(df)

运行上面的代码,输出如下:

     Name  Age
0    Alex   10
1     Bob   12
2  Clarke   13

从字典创建

您也可以使用Python的字典来创建DataFrame。下面是一个通过字典创建DataFrame的示例:

import pandas as pd

# 创建一个字典
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

# 打印输出DataFrame
print(df)

运行上面的代码,输出如下:

     Name  Age
0    Alex   10
1     Bob   12
2  Clarke   13

选择数据

在Pandas中,您可以使用一种类似于SQL的语法来选择数据。下面是一些常用的选择数据的方法。

选择列

您可以通过列名来选择一个或多个列。下面是一个示例:

import pandas as pd

# 创建一个字典
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

# 选择Age列
age = df['Age']

# 打印输出Age列
print(age)

运行上面的代码,输出如下:

0    10
1    12
2    13
Name: Age, dtype: int64

选择行

您可以通过索引或条件来选择行。下面是一些示例:

import pandas as pd

# 创建一个字典
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

# 选择第1行
row1 = df.loc[0]

# 打印输出第1行
print(row1)

# 选择Age列值大于10的行
age_gt_10 = df[df['Age'] > 10]

# 打印输出Age列值大于10的行
print(age_gt_10)

运行上面的代码,输出如下:

Name    Alex
Age       10
Name: 0, dtype: object
     Name  Age
1     Bob   12
2  Clarke   13

写入数据

您可以将DataFrame中的数据写入文件或数据库。下面是一些示例。

写入CSV文件

您可以使用Pandas内置的to_csv()方法将DataFrame的内容写入CSV文件。下面是一个示例:

import pandas as pd

# 创建一个字典
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

# 将DataFrame写入CSV文件
df.to_csv('data.csv')

运行上面的代码后,您将在当前目录下找到一个名为data.csv的文件,其中包含以下内容:

,Name,Age
0,Alex,10
1,Bob,12
2,Clarke,13

写入MySQL数据库

您可以使用Pandas提供的to_sql()方法将DataFrame的内容写入MySQL数据库。下面是一个示例:

import pandas as pd
import pymysql

# 创建一个字典
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

# 连接MySQL数据库
conn = pymysql.connect(host='localhost', user='root', password='password', db='test')

# 将DataFrame写入MySQL数据库
df.to_sql(name='test', con=conn, if_exists='replace', index=False)

# 关闭数据库连接
conn.close()

运行上面的代码后,您将在MySQL数据库中创建一个名为test的表,并将DataFrame的内容写入该表中。

总结

本文介绍了如何使用Python的数据处理库Pandas完成数据分析和数据处理的常用操作。您可以通过创建DataFrame、选择数据和写入数据来操作数据。Pandas是Python数据处理中不可或缺的一部分,它可以让您处理海量数据变得轻松快捷。