下面就为大家讲解一下pandas.concat()的作用与使用方法。
pandas.concat()的作用与概述
pandas.concat是Pandas库提供的一个函数,可以将两个或多个数据集合并为一个。它的作用类似于SQL中的UNION操作。通常的使用场景是将两个有相同字段的表格按行或列的方向进行拼接,生成一个新的表格。
pandas.concat()函数的常用形式为:pandas.concat(objs, axis=0, join="outer", ignore_index=False, keys=None, sort=False, copy=True)
。
其中,参数objs是一个需要被合并的pandas对象的列表或元组,可以是Series、DataFrame或Panel;axis参数指定合并的轴向(0表示按行方向合并,1表示按列方向合并);join参数指定合并方式,默认是outer,表示取并集;ignore_index参数设置为True时,会重新生成新的行索引;keys参数可以为分组创建一个分层级别索引(同时在结果中显示);sort参数则决定合并后结果集的输出方式;copy参数用于决定是否复制数据。
pandas.concat()的使用方法
下面演示一下pandas.concat()函数的具体使用方法。
首先,我们先创建两个DataFrame。
import pandas as pd
import numpy as np
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']})
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7']})
这两个DataFrame中各自都有4列,我们接下来将它们进行拼接。
1.按行拼接(纵向拼接)
以下是按行拼接的示例代码:
df_concat1 = pd.concat([df1, df2], axis=0, ignore_index=True)
print(df_concat1)
运行结果如下:
A B C D
0 A0 B0 C0 D0
1 A1 B1 C1 D1
2 A2 B2 C2 D2
3 A3 B3 C3 D3
4 A4 B4 C4 D4
5 A5 B5 C5 D5
6 A6 B6 C6 D6
7 A7 B7 C7 D7
可以看到,按行拼接后生成了一个新的DataFrame,它由df1和df2纵向拼接而成。ignore_index参数设置为True时,重新生成了新的行索引。
2.按列拼接(横向拼接)
以下是按列拼接的示例代码:
df3 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'],
'F': ['F0', 'F1', 'F2', 'F3'],
'G': ['G0', 'G1', 'G2', 'G3'],
'H': ['H0', 'H1', 'H2', 'H3']})
df_concat2 = pd.concat([df1, df3], axis=1)
print(df_concat2)
运行结果如下:
A B C D E F G H
0 A0 B0 C0 D0 E0 F0 G0 H0
1 A1 B1 C1 D1 E1 F1 G1 H1
2 A2 B2 C2 D2 E2 F2 G2 H2
3 A3 B3 C3 D3 E3 F3 G3 H3
按列拼接后生成了一个新的DataFrame,它由df1和df3横向拼接而成。可以看到,新增加了E、F、G、H四列数据。
结论
以上就是pandas.concat()的作用与使用方法的完整攻略。在实际应用中,pandas.concat()函数能够帮我们快速、方便地进行数据合并,特别是在数据分析、机器学习等领域中经常用到。如果读者还有什么疑问,欢迎提出,我会及时回答。