处理 Pandas DataFrame中的行和列是数据分析中的基本操作之一,可以用来进行数据的筛选、切片和修改。下面给出一些常用的方法和示例说明:
处理行
- 选择行
要选择DataFrame中的一部分行,可以使用.loc
或者.iloc
方法进行操作,其中.loc
方法按照行列标签进行索引,.iloc
方法按照行列的整数索引进行索引。
例如,要选择DataFrame中的第3-5行可以使用以下代码:
df.loc[2:4,:] # 选择第3-5行
df.iloc[2:5,:] # 选择第3-5行
- 过滤行
可以使用.loc
或者.iloc
方法对数据框进行过滤操作。过滤操作是指按照一定的条件筛选出符合条件的行,其中条件通常是一个布尔表达式。例如,要筛选出DataFrame中所有“age”列值大于等于25的行可以使用以下代码:
df[df['age'] >= 25]
处理列
- 选择列
要选择DataFrame中的一部分列,可以使用以下代码:
df.loc[:,['name', 'age']] # 选择“name”和“age”列
- 新增列
可以使用以下代码向DataFrame中新增一列:
df['ID'] = np.arange(len(df)) # 新增一列名为“ID”的列
- 修改列
可以使用以下代码修改DataFrame中的一列:
df['age'] = df['age'] + 1 # 将“age”列的值加1
- 删除列
可以使用以下代码删除DataFrame中的一列:
df.drop('age', axis=1, inplace=True) # 删除名为“age”的列
以上是处理 Pandas DataFrame中的行和列的基本操作,可以根据实际情况进行组合使用和扩展。