- 创建DataFrame对象
要创建DataFrame对象,我们需要至少两个参数:数据和列名。数据可以是列表、字典、Series或NumPy数组。列名是一个字符串列表,用于表示数据中的列名。
import pandas as pd
# 用列表创建DataFrame
data = [['John', 25, 'Male'], ['Jane', 30, 'Female'], ['Mike', 27, 'Male']]
columns = ['Name', 'Age', 'Gender']
df = pd.DataFrame(data, columns=columns)
print(df)
输出结果:
Name Age Gender
0 John 25 Male
1 Jane 30 Female
2 Mike 27 Male
- 索引DataFrame中的数据
Pandas提供了许多方法来索引DataFrame的数据。此处介绍两种最常用的方法:
- loc: 通过标签或布尔数组(True或False)进行索引。
- iloc: 通过整数或布尔数组(True或False)进行索引。
# 用loc进行索引
print(df.loc[0]) # 输出第0行的数据
print(df.loc[:, 'Age']) # 输出Age这一列的数据
# 用iloc进行索引
print(df.iloc[0]) # 输出第0行的数据
print(df.iloc[:, 1]) # 输出第1列的数据
输出结果:
Name John
Age 25
Gender Male
Name: 0, dtype: object
0 25
1 30
2 27
Name: Age, dtype: int64
Name John
Age 25
Gender Male
Name: 0, dtype: object
0 25
1 30
2 27
Name: Age, dtype: int64
3.增添和删除数据
可以使用以下方法添加或删除DataFrame中的数据:
- 添加数据:
# 在末尾添加行
df.loc[3] = ['Lily', 28, 'Female']
print(df)
# 添加一列数据
df['City'] = ['New York', 'Paris', 'Beijing', 'London']
print(df)
输出结果:
Name Age Gender
0 John 25 Male
1 Jane 30 Female
2 Mike 27 Male
3 Lily 28 Female
Name Age Gender City
0 John 25 Male New York
1 Jane 30 Female Paris
2 Mike 27 Male Beijing
3 Lily 28 Female London
- 删除数据:
# 删除一行数据
df = df.drop(1)
print(df)
# 删除一列数据
df = df.drop('City', axis=1)
print(df)
输出结果:
Name Age Gender City
0 John 25 Male New York
2 Mike 27 Male Beijing
3 Lily 28 Female London
Name Age Gender
0 John 25 Male
2 Mike 27 Male
3 Lily 28 Female