如何将Pandas数据框架追加到现有的CSV文件?

  • Post category:Python

首先,我们需要明确 CSV 文件是一种文本文件格式,基于逗号分隔的值。我们可以使用 Python 的 Pandas 库读取和操作 CSV 文件,以及追加数据到现有的 CSV 文件。

以下是如何将 Pandas 数据框架追加到现有的 CSV 文件的详细步骤:

  1. 导入 Pandas 库

在 Python 脚本中,需要使用 import pandas as pd 语句来导入 Pandas 库。

  1. 读取现有的 CSV 文件

使用 Pandas 的 read_csv() 函数来读取现有的 CSV 文件。该函数将 CSV 文件读取为一个 Pandas 数据框架,并使我们能够执行任何 Pandas 数据框架函数,以及将现有 CSV 文件的数据保存为一个变量。

existing_data = pd.read_csv('existing_data.csv')
  1. 创建要追加到 CSV 文件的数据框架

使用 Pandas 库的数据框架函数和数据框架方法创建要追加到现有 CSV 文件的数据框架。

new_data = pd.DataFrame({'Name': ['John', 'Jane', 'Ava'], 'Age': [25, 28, 32], 'City': ['New York', 'London', 'Paris']})
  1. 将新数据追加到现有 CSV 文件

使用 Pandas 库的 to_csv() 方法将新数据追加到现有 CSV 文件。

with open('existing_data.csv', 'a') as f:
    new_data.to_csv(f, header=False, index=False)
  • 使用 with open() 可以避免直接打开文件出现的问题,同时 mode='a' 表示追加模式打开文件。
  • header=False 表示不将新数据的列名写入 CSV 文件(此设置仅在您的 CSV 文件中已经存在列名时适用), index=False 表示不将新数据的索引写入 CSV 文件。

完整的示例代码:

import pandas as pd

# 读取现有的 CSV 文件
existing_data = pd.read_csv('existing_data.csv')

# 创建要追加到 CSV 文件的数据框架
new_data = pd.DataFrame({'Name': ['John', 'Jane', 'Ava'], 'Age': [25, 28, 32], 'City': ['New York', 'London', 'Paris']})

# 将新数据追加到现有 CSV 文件
with open('existing_data.csv', 'a') as f:
    new_data.to_csv(f, header=False, index=False)

执行完毕后,现有 CSV 文件中将添加新数据。