Python3 pandas 操作列表实例详解

  • Post category:Python

下面我将详细讲解 “Python3 pandas 操作列表实例详解”的完整攻略。

一、前言

pandas是数据分析的重要库,在实际工作中常常使用pandas对数据进行处理和分析。其中最为常用的是 DataFrame 数据类型。DataFrame 类型很像一个二维数组,能够方便地操作行和列,所以经常被用来存储和操作大型数据集。DataFrame中的数据是可变的,可以根据需要对行和列进行增删改查等操作。

在日常开发中,我们经常需要对列表数据进行分析,例如:排序、统计、添加新数据等。本文将主要介绍如何使用 pandas 对列表数据进行操作。

二、pandas 操作列表

2.1 pandas 数据结构

pandas 中最基本的数据结构是 Series 和 DataFrame 。其中 Series 类型是一个一维数组,可以包含任意类型的数据。DataFrame 类型使用多个 Series 或一维数组创建,可以看作是一个类似二维表的数据结构。

下面是一个 Series 和 DataFrame 类型的示例:

import pandas as pd

# 创建 Series 类型示例
s = pd.Series([1, 3, 5, pd.NA, 6, 8])

# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
        'age': [18, 21, 19, 20],
        'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)

2.2 常用列表操作

2.2.1 列表排序

pandas 中可以使用 sort_values() 方法对 DataFrame 的某一列进行排序,sort_values() 方法有以下参数:

  • by:【必选参数】排序的列名;
  • axis:【可选参数】排序的方向,0表示按列名排序(默认),1表示按行名排序;
  • ascending:【可选参数】排序的顺序,True表示升序排列(默认),False表示降序排列。

示例如下:

import pandas as pd

# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
        'age': [18, 21, 19, 20],
        'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)

# 对 age 列进行升序排序
df = df.sort_values(by='age', ascending=True)
print(df)

输出结果如下:

name    age gender
0    Tom    18      M
2   Mike    19      M
3   Jack    20      F
1  Jerry    21      M

2.2.2 统计列表信息

pandas 中可以使用 describe() 方法实现对 DataFrame 中各列数据的统计分析,包括数据总数、平均数、标准差、最小值、25%、50%、75%、最大值等。

示例如下:

import pandas as pd

# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
        'age': [18, 21, 19, 20],
        'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)

# 统计各列数据的分布情况
describe = df.describe()
print(describe)

输出结果如下:

     age
count   4.000000
mean   19.500000
std     1.290994
min    18.000000
25%    18.750000
50%    19.500000
75%    20.250000
max    21.000000

2.2.3 添加新数据

pandas 中可以使用 append() 方法实现向 DataFrame 中添加新行数据的功能。append() 方法有以下参数:

  • other:【必选参数】要添加的数据,可为一个 Series/DataFrame 类型或可迭代类型;
  • ignore_index:【可选参数】表示是否按默认的索引进行排序,默认为 False。

示例如下:

import pandas as pd

# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
        'age': [18, 21, 19, 20],
        'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)

# 添加新数据
new_data = {'name': 'Rose', 'age': 22, 'gender': 'F'}
df = df.append(new_data, ignore_index=True)
print(df)

输出结果如下:

    name  age gender
0    Tom   18     M
1  Jerry   21     M
2   Mike   19     M
3   Jack   20     F
4   Rose   22     F

以上就是 pandas 操作列表的常用方法了,更多详细信息请参考pandas官方文档

三、总结

通过本文,我们了解了 pandas 操作列表的基本技能,包括列表的排序、统计信息和添加新数据。希望可以帮助读者更好地使用 pandas 进行数据分析和处理。在实际开发中,我们还需要结合具体业务场景进行深入研究和实践。