如何将Pandas Dataframe保存为gzip/zip文件

  • Post category:Python

将Pandas Dataframe保存为gzip/zip文件的过程分为以下两个部分:

  1. 将Dataframe转换为压缩格式的数据

使用Pandas库中的to_csv()函数,可以将Dataframe保存为CSV格式的文件。默认情况下,该函数输出的CSV文件是未压缩的。要将输出的CSV文件压缩为gzip或zip文件,需要传递相应的压缩参数到to_csv()函数中。

压缩为gzip文件的实例:

import pandas as pd

# 创建一个Dataframe对象
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'gender': ['F', 'M', 'M']})

# 将Dataframe保存为gzip格式的文件
df.to_csv('dataframe.gz', compression='gzip', index=False)

上述代码将Dataframe保存为了名为”dataframe.gz”的gzip文件。

压缩为zip文件的实例:

import pandas as pd

# 创建一个Dataframe对象
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'gender': ['F', 'M', 'M']})

# 将Dataframe保存为zip格式的文件
df.to_csv('dataframe.zip', compression='zip', index=False)

上述代码将Dataframe保存为了名为”dataframe.zip”的zip文件。

  1. 解压缩压缩数据并读取Dataframe

保存为gzip/zip文件的Dataframe需要解压缩后才能读取。可以使用Pandas库中的read_csv()函数读取压缩文件并解压缩数据。

解压缩gzip文件的实例:

import pandas as pd

# 从gzip格式的文件中读取Dataframe
df_gzip = pd.read_csv('dataframe.gz', compression='gzip')

# 打印读取的Dataframe
print(df_gzip)

上述代码从名为”dataframe.gz”的gzip文件中读取Dataframe并打印。

解压缩zip文件的实例:

import pandas as pd

# 从zip格式的文件中读取Dataframe
df_zip = pd.read_csv('dataframe.zip', compression='zip')

# 打印读取的Dataframe
print(df_zip)

上述代码从名为”dataframe.zip”的zip文件中读取Dataframe并打印。

以上就是将Pandas Dataframe保存为gzip/zip文件的完整攻略。