pandas dataframe drop函数介绍
pandas是一个广泛应用于数据科学的Python库。它包含了许多用于数据分析和操作的函数和工具。dataframe是pandas中最常用的数据结构,它类似于电子表格,可以方便地进行数据处理和分析。其中的drop函数就是一种处理dataframe的方法。
drop函数的基本使用
语法:df.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
常用参数:
* labels:要删除的行或列的标签,可以是单个标签或标签列表。
* axis:要删除的轴,0表示行,1表示列。
* index或columns:要删除的行或列的标签,仅在axis=0或axis=1时使用。
* level:如果轴包含层级索引,则确定要删除哪些级别的标签。
* inplace:指示是否将更改应用于原始数据,而不是创建副本。默认为False。
* errors:指示是否引发异常。默认为“raise”。
示例1: 删除dataframe中的一列。
import pandas as pd
data = {'Album': ['Thriller', 'Back in Black', 'The Dark Side of the Moon', 'The Bodyguard', 'Bat out of Hell'],
'Artist': ['Michael Jackson', 'AC/DC', 'Pink Floyd', 'Whitney Houston', 'Meat Loaf'],
'Released': [1982, 1980, 1973, 1992, 1977],
'Sales': [65, 50, 45, 44, 43]}
df = pd.DataFrame(data)
# 删除Sales列
df.drop(['Sales'], axis=1, inplace=True)
print(df.head())
输出结果:
Album Artist Released
0 Thriller Michael Jackson 1982
1 Back in Black AC/DC 1980
2 The Dark Side of the Moon Pink Floyd 1973
3 The Bodyguard Whitney Houston 1992
4 Bat out of Hell Meat Loaf 1977
示例2:删除dataframe中的一行。
import pandas as pd
data = {'Album': ['Thriller', 'Back in Black', 'The Dark Side of the Moon', 'The Bodyguard', 'Bat out of Hell'],
'Artist': ['Michael Jackson', 'AC/DC', 'Pink Floyd', 'Whitney Houston', 'Meat Loaf'],
'Released': [1982, 1980, 1973, 1992, 1977],
'Sales': [65, 50, 45, 44, 43]}
df = pd.DataFrame(data)
# 删除第2行
df.drop([1], axis=0, inplace=True)
print(df.head())
输出结果:
Album Artist Released Sales
0 Thriller Michael Jackson 1982 65
2 The Dark Side of the Moon Pink Floyd 1973 45
3 The Bodyguard Whitney Houston 1992 44
4 Bat out of Hell Meat Loaf 1977 43
总结
dataframe的drop函数是一种处理dataframe的方法,可以用它删除行或列,或者删除具有特定标签的行或列。在实际应用中,根据不同的需求选择合适的参数和使用方法即可。