调整pandas数据框中列的顺序以及添加新列是数据分析中常用的操作,下面是具体实现步骤。
调整数据框中列的顺序
pandas中可以使用reindex()方法调整数据框的列顺序。
代码示例
import pandas as pd
# 构造数据框
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# 打印原始数据框
print(df)
# 调整数据框列的顺序
df = df.reindex(columns=['B', 'C', 'A'])
# 打印调整后的数据框
print(df)
运行结果
A B C
0 1 4 7
1 2 5 8
2 3 6 9
B C A
0 4 7 1
1 5 8 2
2 6 9 3
添加新列
pandas中可以使用assign()方法添加一个或多个新列到数据框中。
代码示例
import pandas as pd
# 构造数据框
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# 打印原始数据框
print(df)
# 添加新列
df = df.assign(D=[10, 11, 12], E=[13, 14, 15])
# 打印添加新列后的数据框
print(df)
运行结果
A B C
0 1 4 7
1 2 5 8
2 3 6 9
A B C D E
0 1 4 7 10 13
1 2 5 8 11 14
2 3 6 9 12 15
以上是使用pandas调整列的顺序以及添加列的实现的完整攻略。