下面我将详细讲解 “Python3 pandas 操作列表实例详解”的完整攻略。
一、前言
pandas是数据分析的重要库,在实际工作中常常使用pandas对数据进行处理和分析。其中最为常用的是 DataFrame 数据类型。DataFrame 类型很像一个二维数组,能够方便地操作行和列,所以经常被用来存储和操作大型数据集。DataFrame中的数据是可变的,可以根据需要对行和列进行增删改查等操作。
在日常开发中,我们经常需要对列表数据进行分析,例如:排序、统计、添加新数据等。本文将主要介绍如何使用 pandas 对列表数据进行操作。
二、pandas 操作列表
2.1 pandas 数据结构
pandas 中最基本的数据结构是 Series 和 DataFrame 。其中 Series 类型是一个一维数组,可以包含任意类型的数据。DataFrame 类型使用多个 Series 或一维数组创建,可以看作是一个类似二维表的数据结构。
下面是一个 Series 和 DataFrame 类型的示例:
import pandas as pd
# 创建 Series 类型示例
s = pd.Series([1, 3, 5, pd.NA, 6, 8])
# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
'age': [18, 21, 19, 20],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
2.2 常用列表操作
2.2.1 列表排序
pandas 中可以使用 sort_values() 方法对 DataFrame 的某一列进行排序,sort_values() 方法有以下参数:
- by:【必选参数】排序的列名;
- axis:【可选参数】排序的方向,0表示按列名排序(默认),1表示按行名排序;
- ascending:【可选参数】排序的顺序,True表示升序排列(默认),False表示降序排列。
示例如下:
import pandas as pd
# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
'age': [18, 21, 19, 20],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 对 age 列进行升序排序
df = df.sort_values(by='age', ascending=True)
print(df)
输出结果如下:
name age gender
0 Tom 18 M
2 Mike 19 M
3 Jack 20 F
1 Jerry 21 M
2.2.2 统计列表信息
pandas 中可以使用 describe() 方法实现对 DataFrame 中各列数据的统计分析,包括数据总数、平均数、标准差、最小值、25%、50%、75%、最大值等。
示例如下:
import pandas as pd
# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
'age': [18, 21, 19, 20],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 统计各列数据的分布情况
describe = df.describe()
print(describe)
输出结果如下:
age
count 4.000000
mean 19.500000
std 1.290994
min 18.000000
25% 18.750000
50% 19.500000
75% 20.250000
max 21.000000
2.2.3 添加新数据
pandas 中可以使用 append() 方法实现向 DataFrame 中添加新行数据的功能。append() 方法有以下参数:
- other:【必选参数】要添加的数据,可为一个 Series/DataFrame 类型或可迭代类型;
- ignore_index:【可选参数】表示是否按默认的索引进行排序,默认为 False。
示例如下:
import pandas as pd
# 创建 DataFrame 类型示例
data = {'name': ['Tom', 'Jerry', 'Mike', 'Jack'],
'age': [18, 21, 19, 20],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 添加新数据
new_data = {'name': 'Rose', 'age': 22, 'gender': 'F'}
df = df.append(new_data, ignore_index=True)
print(df)
输出结果如下:
name age gender
0 Tom 18 M
1 Jerry 21 M
2 Mike 19 M
3 Jack 20 F
4 Rose 22 F
以上就是 pandas 操作列表的常用方法了,更多详细信息请参考pandas官方文档。
三、总结
通过本文,我们了解了 pandas 操作列表的基本技能,包括列表的排序、统计信息和添加新数据。希望可以帮助读者更好地使用 pandas 进行数据分析和处理。在实际开发中,我们还需要结合具体业务场景进行深入研究和实践。