Python  处理 Pandas DataFrame 中的行和列

  • Post category:Python

处理 Pandas DataFrame中的行和列是数据分析中的基本操作之一,可以用来进行数据的筛选、切片和修改。下面给出一些常用的方法和示例说明:

处理行

  • 选择行

要选择DataFrame中的一部分行,可以使用.loc或者.iloc方法进行操作,其中.loc方法按照行列标签进行索引,.iloc方法按照行列的整数索引进行索引。

例如,要选择DataFrame中的第3-5行可以使用以下代码:

df.loc[2:4,:]   # 选择第3-5行
df.iloc[2:5,:]  # 选择第3-5行
  • 过滤行

可以使用.loc或者.iloc方法对数据框进行过滤操作。过滤操作是指按照一定的条件筛选出符合条件的行,其中条件通常是一个布尔表达式。例如,要筛选出DataFrame中所有“age”列值大于等于25的行可以使用以下代码:

df[df['age'] >= 25]

处理列

  • 选择列

要选择DataFrame中的一部分列,可以使用以下代码:

df.loc[:,['name', 'age']]  # 选择“name”和“age”列
  • 新增列

可以使用以下代码向DataFrame中新增一列:

df['ID'] = np.arange(len(df))  # 新增一列名为“ID”的列
  • 修改列

可以使用以下代码修改DataFrame中的一列:

df['age'] = df['age'] + 1  # 将“age”列的值加1
  • 删除列

可以使用以下代码删除DataFrame中的一列:

df.drop('age', axis=1, inplace=True)  # 删除名为“age”的列

以上是处理 Pandas DataFrame中的行和列的基本操作,可以根据实际情况进行组合使用和扩展。