python中pandas.DataFrame的简单操作方法(创建、索引、增添与删除)

  • Post category:Python
  1. 创建DataFrame对象

要创建DataFrame对象,我们需要至少两个参数:数据和列名。数据可以是列表、字典、Series或NumPy数组。列名是一个字符串列表,用于表示数据中的列名。

import pandas as pd

# 用列表创建DataFrame
data = [['John', 25, 'Male'], ['Jane', 30, 'Female'], ['Mike', 27, 'Male']]
columns = ['Name', 'Age', 'Gender']
df = pd.DataFrame(data, columns=columns)
print(df)

输出结果:

   Name  Age  Gender
0  John   25    Male
1  Jane   30  Female
2  Mike   27    Male
  1. 索引DataFrame中的数据

Pandas提供了许多方法来索引DataFrame的数据。此处介绍两种最常用的方法:

  • loc: 通过标签或布尔数组(True或False)进行索引。
  • iloc: 通过整数或布尔数组(True或False)进行索引。
# 用loc进行索引
print(df.loc[0]) # 输出第0行的数据
print(df.loc[:, 'Age']) # 输出Age这一列的数据

# 用iloc进行索引
print(df.iloc[0]) # 输出第0行的数据
print(df.iloc[:, 1]) # 输出第1列的数据

输出结果:

Name      John
Age         25
Gender    Male
Name: 0, dtype: object
0    25
1    30
2    27
Name: Age, dtype: int64
Name      John
Age         25
Gender    Male
Name: 0, dtype: object
0    25
1    30
2    27
Name: Age, dtype: int64

3.增添和删除数据

可以使用以下方法添加或删除DataFrame中的数据:

  • 添加数据:
# 在末尾添加行
df.loc[3] = ['Lily', 28, 'Female']
print(df)

# 添加一列数据
df['City'] = ['New York', 'Paris', 'Beijing', 'London']
print(df)

输出结果:

   Name  Age  Gender
0  John   25    Male
1  Jane   30  Female
2  Mike   27    Male
3  Lily   28  Female

   Name  Age  Gender      City
0  John   25    Male  New York
1  Jane   30  Female     Paris
2  Mike   27    Male   Beijing
3  Lily   28  Female    London
  • 删除数据:
# 删除一行数据
df = df.drop(1)
print(df)

# 删除一列数据
df = df.drop('City', axis=1)
print(df)

输出结果:

   Name  Age  Gender      City
0  John   25    Male  New York
2  Mike   27    Male   Beijing
3  Lily   28  Female    London

   Name  Age  Gender
0  John   25    Male
2  Mike   27    Male
3  Lily   28  Female