如何将多个CSV文件合并到一个Pandas数据框中

  • Post category:Python

将多个 CSV 文件合并到一个 Pandas 数据框中可以使用 Pandas 库中的 concat 方法。下面是具体步骤:

1.导入 pandas 库和 glob 库,前者用于处理数据,后者用于查找文件路径。

import pandas as pd
import glob

2.使用 glob 库查找所需要合并的 CSV 文件的路径。

csv_files = glob.glob('path/to/files/*.csv')

这里需要注意的是,需要替换上面的 path/to/files 为你实际存放 CSV 文件的路径。

3.通过 for 循环将每个 CSV 文件读取到 Pandas 数据框中。

dfs = []
for file in csv_files:
    df = pd.read_csv(file)
    dfs.append(df)

这里需要注意的是,为了后续合并时的数据不出现重复,最好将每个数据框赋予一个独特的名称。

4.使用 Pandas 库中的 concat 方法将多个数据框合并到一个数据框中。

merged_df = pd.concat(dfs, ignore_index=True)

其中, ignore_index=True 表示忽略原来数据框中的索引,重新生成一个新的索引。

5.可以根据需要对合并后的数据框进行处理和分析。

完整的代码如下所示:

import pandas as pd
import glob

# 查找 CSV 文件路径
csv_files = glob.glob('path/to/files/*.csv')

# 将每个 CSV 文件读取到 Pandas 数据框中
dfs = []
for file in csv_files:
    df = pd.read_csv(file)
    dfs.append(df)

# 合并多个数据框到一个数据框中
merged_df = pd.concat(dfs, ignore_index=True)

# 对合并后的数据框进行处理和分析
print(merged_df.head())

这样就可以将多个 CSV 文件成功合并到一个 Pandas 数据框中了。